Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Autor:
CONTENIDO
UNIDAD I
TEORIA DEL MUESTREO
1.- SESGO Y ERROR EN EL MUESTREO
2.- SELECCIN DE UNA MUESTRA ALEATORIA
3.- POBLACIONES Y MUESTRAS
4.- ESTIMACION BASADA EN UNA MUESTRA ALEATORIA
5.- PARAMETROS Y ESTADISTICOS
6.- MUESTREO ALEATORIO ESTRATIFICADO
7.- MUESTREO POR CONGLOMERADOS
8.- DETERMINACION DEL TAMAO DE MUESTRA
UNIDAD II
DISTRIBUCIONES MUESTRALES
1.- DISTRIBUCIONES RELACIONADAS CON LA DISTRIBUCION NORMAL: JI CUADRADA,
t Y F.
2.- TEOREMACENTRAL DEL LMITE
3.- DISTRIBUCION DE MUESTREO PARA LA MEDIA MUESTRAL
4.- DISTRIBUCION DE LA PROPORCION MUESTRAL
UNIDAD III
ESTIMACION
1.- DEFINICION DE ESTIMADOR Y ESTIMACION
2.- PROPIEDADES DE LOS ESTIMADORES: INSESGAMIENTO, INSESGAMIENTO
ASINTOTICO, CONSISTENCIA, ERROR CUADRATICO MEDIO, EFICIENCIA
3.- ESTIMACION DE LA MEDIA, LA VARIANZA Y PROPORCIONES
UNIDAD IV
INTERVALOS DE CONFIANZA
1.- CONCEPTO DE INTERVALO DE CONFIANZA
2.- INTERVALOS DE CONFIANZA PARA LA MEDIA
3.- INTERVALO DE CONFIANZA PARA PROPORCIONES
UNIDAD V
PRUEBAS DE HIPOTESIS
1.- CONCEPTO DE PRUEBAS DE HIPOTESIS
2.- TIPOS DE ERROR Y NIVEL DE SIGNIFICANCIA
3.- CURVA CARACTERISTICA OPERATIVA Y CURVA DE POTENCIA
4.- PRUEBAS DE HIPOTESIS PARA LA MEDIA Y PROPORCIONES
INTRODUCCION
UNIDAD I
Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras reflejen
observaciones a la poblacin de la que proceden, ya que solo se pueden hacer observaciones
probabilsticas sobre una poblacin cuando se usan muestras representativas de la misma.
ERRORES EN EL MUESTREO
Los errores que surgen al tomar las muestras no pueden clasificarse como errores mustrales y
se denominan errores no mustrales.
El sesgo de las muestras es un tipo de error no muestral.
ERROR MUESTRAL
Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la media
poblacional , entonces la media muestral, como medida, conlleva algn error. Por ejemplo,
supongamos que se ha obtenido una muestra aleatoria de tamao 25 de una poblacin con
media = 15: si la media de la muestra es x=12, entonces a la diferencia observada x- = -3
se le denomina el error muestral. Una media muestral x puede pensarse como la suma de dos
cantidades, la media poblacional y el error muestral; si e denota el error muestral,
Entonces:
Ejemplo 1.5
(2,2) 2 2 4 = -2
(2,4) 3 3 4 = -1
(2,6) 4 44=0
(4,2) 3 3 4 = -1
(4,4) 4 44=0
(4,6) 5 54=1
(6,2) 4 44=0
(6,4) 5 54=1
(6,6) 6 64=2
MUESTRAS ALEATORIAS
Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan muestras
por muchas razones; una enumeracin completa de la poblacin, llamada censo, puede ser
econmicamente imposible, o no se cuenta con el tiempo suficiente.
1. Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinin pblica y el apoyo en las elecciones.
2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan
para determinar la eficiencia de una tcnica o programa de enseanza.
3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la
calidad.
4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban
la eficacia de una tcnica o de un frmaco nuevo.
5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la
produccin los efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los
criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.
Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio simple, el
muestreo estratificado, el muestreo por conglomerados y el muestreo sistemtico.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin tengan
la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.
Ejemplo 1.1
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadstica de 20 alumnos. 20C5 da el nmero total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las
15,504 en trozos separados de papel, una tarea tremenda, luego los colocamos en un
recipiente y despus los revolvemos, entonces podremos tener una muestra aleatoria de 5 si
seleccionamos un trozo de papel con cinco nombres.
Un procedimiento ms simple para elegir una muestra aleatoria sera escribir cada uno de los
20 nombres en pedazos separados de papel, colocarlos en un recipiente, revolverlos y despus
extraer cinco papeles al mismo tiempo.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico, imposible
o no deseado; aunque sera deseable usar muestras aleatorias simples para las encuestas
nacionales de opinin sobre productos o sobre elecciones presidenciales, sera muy costoso o
tardado.
Una poblacin est formada por la totalidad de las observaciones en las cuales se tiene cierto
observa.
Parmetros poblacionales
Se llama parmetros poblacionales a cantidades que se obtienen a partir de las
observaciones de la variable y sus probabilidades y que determinan perfectamente la
distribucin de esta, as como las caractersticas de la poblacin, por ejemplo: La media, , la
varianza 2, la proporcin de determinados sucesos, P.
Los Parmetros poblacionales son nmeros reales, constantes y nicos.
Parmetros mustrales
Los Parmetros mustrales son resmenes de la informacin de la muestra que nos
"determinan" la estructura de la muestra.
Los Parmetros mustrales no son constantes sino variables aleatorias pues sus valores
dependen de la estructura de la muestra que no es siempre la misma como consecuencia del
muestreo aleatorio. A estas variables se les suele llamar estadsticos.
Los estadsticos se transforman en dos tipos: estadsticos de centralidad y estadsticos de
dispersin.
ESTADSTICOS DE CENTRALIDAD:
La media aritmtica
Es el valor esperado de las observaciones de la muestra calculada como si la muestra fuera
una variable completa, es decir, multiplicando observaciones por frecuencias y sumando.
Si x1, x2,.., xn representan una muestra de tamao n de la poblacin, la media aritmtica se
calcula como:
La media aritmtica es la medida de la tendencia central que posee menor varianza. Engloba
en ella toda la informacin de la muestra; esto, con ser una ventaja, supone una cierta
desventaja pues los valores muy extremos, en muestras pequeas afectan mucho a la media.
La media de la media aritmtica es igual a la de las observaciones () y su varianza es igual a
la de las observaciones partidas por n. En poblaciones normales, la distribucin de la media es
normal,
Si la poblacin no es normal, pero la muestra es grande (n 30), por el teorema central del
lmite la distribucin de la media ser asintticamente normal.
La mediana
En una variable se define como el punto para el cual la funcin de distribucin alcance el
valor 0.5; en una muestra la mediana es el valor central.
Para calcularla se ordenan las observaciones de menor a mayor. Si n es impar, la mediana es
la observacin central
En resumen, podramos decir que la mediana es el valor que es mayor o igual que el 50% de
las observaciones de la muestra y menor o igual que el otro 50%.
No tiene por qu ser igual a una de las observaciones de la muestra.
Es ms fcil de calcular que la media aritmtica y apenas se afecta por observaciones
extremas; sin embargo tiene mayor varianza que X y slo toma en cuenta la informacin de
los valores centrales de la muestra.
La moda
Es el valor ms frecuente.
Su clculo es el ms simple de los tres correspondientes a estadsticos de centralidad pero la
moda es el estadstico de mayor varianza.
La moda puede no existir y cuando existe no es necesariamente nica. No tiene sentido en
muestras pequeas en las que la aparicin de coincidencias en los valores es con gran
frecuencia ms producto del azar que de otra cosa.
ESTADSTICOS DE DISPERSIN
Los estadsticos de dispersin son parmetros muestrales que expresan la dispersin de los
valores de la variable respecto al punto central, es decir, su posicin relativa. Los ms
importantes son:
El rango
Es la diferencia entre las dos observaciones extremas, la mxima menos la mnima. Expresa
cuantas unidades de diferencia podemos esperar, como mximo, entre dos valores de la
variable.
El rango estima el campo de variacin de la variable.
Se afecta mucho por observaciones extremas y utiliza nicamente una pequea parte de la
informacin.
La varianza
Es la desviacin cuadrtica media de las observaciones a la media muestral.
La desviacin tpica
Es la raz cuadrada positiva de la varianza y, por tanto, se expresa en las unidades de medida
de la variable.
MUESTREO ESTRATIFICADO
Ejemplo 1.2
Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una gran
universidad. Puede ser difcil obtener una muestra con todos los profesores, as que
supongamos que elegimos una muestra aleatoria de cada colegio, o departamento acadmico;
los estratos vendran a ser los colegios, o departamentos acadmicos.
El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de unidades
heterogneas entre s de la poblacin llamadas conglomerados. Cada elemento de la
poblacin pertenece exactamente a un conglomerado, y los elementos dentro de cada
conglomerado son usualmente heterogneos o dismiles.
Ejemplo 1.3
Suponga que una compaa de servicio de televisin por cable est pensando en abrir una
sucursal en una ciudad grande; la compaa planea realizar un estudio para determinar el
porcentaje de familias que utilizaran sus servicios, como no es prctico preguntar en cada
casa, la empresa decide seleccionar una parte de la ciudad al azar, la cual forma un
conglomerado.
En el muestreo por conglomerados, stos se forman para representar, tan fielmente como sea
posible, a toda la poblacin; entonces se usa una muestra aleatoria simple de conglomerados
para estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y
prisiones se realizan, generalmente, con base en el muestreo por conglomerados.
El muestreo sistemtico es una tcnica de muestreo que requiere de una seleccin aleatoria
inicial de observaciones seguida de otra seleccin de observaciones obtenida usando algn
sistema o regla.
UNIDAD II
DISTRIBUCIONES MUSTRALES
Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia, impredecibles.
No se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma
poblacin tenga la misma media muestral o que sean completamente parecidas; puede
esperarse que cualquier estadstico, como la media muestral, calculado a partir de las medias
en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la
distribucin de todos los valores posibles de un estadstico. Tales distribuciones sern muy
importantes en el estudio de la estadstica inferencial, porque las inferencias sobre las
poblaciones se harn usando estadsticas muestrales. Como el anlisis de las distribuciones
asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de un estadstico
muestral como un instrumento para hacer inferencias sobre un parmetro poblacional
desconocido.
Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se le
puede considerar como una variable aleatoria con su correspondiente distribucin de
frecuencias.
La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral.
En general, la distribucin muestral de un estadstico es la de todos sus valores posibles
calculados a partir de muestras del mismo tamao.
Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin grande.
Se calcula la madia muestral x para cada muestra; la coleccin de todas estas medias
muestrales recibe el nombre de distribucin muestral de medias, lo que se puede ilustrar en
la siguiente figura:
Suponga que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se
calcula la desviacin estndar de cada una. La coleccin de todas estas desviaciones estndar
muestrales se llama distribucin muestral de la desviacin estndar, y lo podemos ver en
la siguiente figura:
Ejemplo 1.6
Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0, 2, 4 y
6. Encuentre:
, la media poblacional.
, la desviacin estndar poblacional.
x, la media de la distribucin muestral de medias.
x, la desviacin estndar de la distribucin muestral de medias.
Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias.
Solucin:
De
Distribuciones muestrales
Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral se
genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y
calculndoles a stas su estadstico.
Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de medias
ser normal sin importar el tamao de la muestra.
, el estadstico:
tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1 grados de
libertad y se denota X2 (X es la minscula de la letra griega ji). El estadstico ji-cuadrada esta
dado por:
para x>0
La tabla que se utilizar para estos apuntes es la del libro de probabilidad y estadstica de
Walpole, la cual da valores crticos (gl) para veinte valores especiales de . Para
denotar el valor crtico de una distribucin X2 con gl grados de libertad se usa el smbolo
(gl); este valor crtico determina a su derecha un rea de bajo la curva X2 y sobre el
2
eje horizontal. Por ejemplo para encontrar X 0.05(6) en la tabla se localiza 6 gl en el lado
izquierdo y a o largo del lado superior de la misma tabla.
Clculo de Probabilidad
El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para saber
como se va a comportar la varianza o desviacin estndar en una muestra que proviene de una
distribucin normal.
Ejemplos:
Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus destinos en
una ciudad grande forman una distribucin normal con una desviacin estndar =1 minuto.
Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza
muestral sea mayor que 2.
Solucin:
Primero se encontrar el valor de ji-cuadrada correspondiente a s2=2 como sigue:
y
Aqu se tienen que buscar los dos valores en el rengln de 24 grados de libertad. Al buscar el
valor de 13.846 se encuentra un rea a la derecha de 0.95. El valor de 42.98 da un rea a la
derecha de 0.01. Como se est pidiendo la probabilidad entre dos valores se resta el rea de
0.95 menos 0.01 quedando 0.94.
Por lo tanto la P(3.462 s2 10.745) = 0.94
Estimacin de la Varianza
Para poder estimar la varianza de una poblacin normal se utilizar la distribucin ji-
cuadrada.
Ejemplos:
Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas
por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un
intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que
distribuye esta compaa, suponga una poblacin normal.
Solucin:
Primero se calcula la desviacin estndar de la muestra:
Se puede observar en la grfica anterior que el valor de X2 corre en forma normal, esto es de
izquierda a derecha.
Por lo tanto, el intervalo de confianza de 95% para la varianza es:
Graficamente:
Se observa que la varianza corre en sentido contrario, pero esto es slo en la grfica. La
interpretacin quedara similar a nuestros temas anteriores referentes a estimacin. Con un
nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los
paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.
poca evidencia para indicar que y no son iguales. Por otra parte, un valor muy
grande o muy pequeo para s21/s22, proporcionar evidencia de una diferencia en las varianzas
de las poblaciones.
La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada
independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,
para
para
Para manejar las tablas de Fisher del libro de Introduccin a la Inferencia Estadstica del autor
Genther, se tendr que buscar primero los grados de libertad dos para luego localizar el rea
correspondiente, relacionndola con los grados de libertad uno, para calcular el valor de F.
Las tablas tienen la siguiente estructura:
P 1 2 3 . .. 500
6 0.0005
0.001
0.005
0.9995 30.4
El valor de 30.4 es el correspondiente a una Fisher que tiene 3 grados de libertad uno y 6
grados de libertad dos con un rea de cero a Fisher de 0.995. Si lo vemos graficamente:
Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de
dos variables que son los grados de libertad.
Ejemplos :
Encontrar el valor de F, en cada uno de los siguientes casos:
En este caso se puede buscar el rea de 0.95 directamente en la tabla con sus respectivos
grados de libertad.
Se tiene que buscar en la tabla un rea de 0.05, puesto que nos piden un rea a la derecha de F
de 0.95.
Si s12 y s22 son las varianzas muestrales de muestras aleatorias independientes de tamaos
n1=10 y n2 =20, tomadas de poblaciones normales que tienen las mismas varianzas, encuentre
P(s12/s22 2.42).
Solucin:
Primero se establecen los grados de libertad. Como en el numerador est la poblacin uno y
en el denominador la poblacin dos, entonces los grados de libertad uno equivalen a 10-1=9 y
los grados de libertad dos a 20-1=19.
Se procede a ir a la tabla a buscar los grados de libertad dos que son 19 y se observa que no
estn, por lo tanto se tiene que interpolar entre 15 y 20 grados de libertad, buscando el valor
de fisher que quedara:
Este valor de 2.42 se busca en la columna de 9 grados de libertad uno, con 15 grados de
libertad dos, y se encuentra los siguiente:
Area
0.90 2.09
0.95 2.59
Area
0.95 2.39
0.975 2.84
Area
15 0.933
20 0.9516
Al interpolar nos queda que para 9 grados de libertad uno y 19 grados de libertad dos con un
valor de Fisher de 2.42 el rea a la izquierda es de 0.9478.
Si s12 y s22 representan las varianzas de las muestras aleatorias independientes de tamao n1=
2
25 y n2 = 31, tomadas de poblaciones normales con varianzas 1 =10 y
2 2 2
2 = 15, respectivamente, encuentre P(s1 /s2 > 1.26).
Solucin:
Calcular el valor de Fisher:
n1 = 31 n2 = 25
s12 = 50 s22 = 24
2 2
Construya un intervalo de confianza del 90% para 1 / 2 .
Solucin:
Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la
siguiente frmula:
al despejar: .
F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este
caso los grados de libertad uno valen 30 y los grados de libertad dos 24.
y
Estos resultados los podemos interpretar de la siguiente manera:
2 2
Con un nivel de confianza del 90% se sabe que la relacin de varianzas 1 / 2 esta entre
1.07 y 3.93. Esto supondra que la varianza de la poblacin 1 es mayor a la varianza de la
poblacin 2 entre 1.07 y 3.93.
Una compaa fabrica propulsores para uso en motores de turbina. Al ingeniero de
manufactura le gustara seleccionar el proceso que tenga la menor variabilidad en la rugosidad
de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene
una desviacin estndar s1 = 4.7 micropulgadas, y una muestra aleatoria de n2=12 partes del
segundo proceso, la cual tiene una desviacin estndar s2 = 5.1 micropulgadas. Se desea
2
encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas 1 /
2
2 . Suponga que los dos procesos son independientes y que la rugosidad de la superficie est
distribuida de manera normal.
Solucin:
Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la
siguiente frmula:
al despejar: .
En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15.
Supngase que se toma una muestra de una poblacin normal con media y varianza
es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la
Se acostumbra representar con el valor t por arriba del cual se encuentra un rea igual a
. Como la distribucin t es simtrica alrededor de una media de cero,
Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se
tiene que hacer la resta de . La manera de encontrar el valor de t es buscar el valor de
en el primer rengln de la tabla y luego buscar los grados de libertad en la primer
columna y donde se intercepten y se obtendr el valor de t.
Ejemplo:
Encuentre la probabilidad de t0.025 < t < t0.05.
Solucin:
Como t0.05 deja un rea de 0.05 a la derecha, y t0.025 deja un rea de 0.025 a la izquierda,
encontramos un rea total de 1-0.05-0.025 = 0.925.
P( t0.025 < t < t0.05) = 0.925
Ejemplo:
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamao 15 que se
selecciona de una distribucin normal.
Solucin:
Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a
este valor le corresponde un rea de 0.05 a la izquierda, por ser negativo el valor. Entonces si
se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a
valor de 0.005 en el primer rengln con 14 grados de libertad y se obtiene un valor de t =
2.977, pero como el valor de est en el extremo izquierdo de la curva entonces la
respuesta es t = -2.977 por lo tanto:
P(-2.977 < t < -1.761) = 0.045
Ejemplo:
Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto proceso en
lotes es 500 gramos por milmetro de materia prima. Para verificar esta afirmacin toma una
muestra de 25 lotes cada mes. Si el valor de t calculado cae entre t0.05 y t0.05, queda satisfecho
con su afirmacin. Qu conclusin extraera de una muestra que tiene una media de 518
gramos por milmetro y una desviacin estndar de 40 gramos? Suponga que la distribucin
de rendimientos es aproximadamente normal.
Solucin:
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el
fabricante queda satisfecho con esta afirmacin si una muestra de 25 lotes rinde un valor t
entre 1.711 y 1.711.
Se procede a calcular el valor de t:
Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un
valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02. De aqu que es probable que el fabricante concluya que el proceso
produce un mejor producto del que piensa.
estndar de . La aproximacin ser cada vez ms exacta a medida de que n sea cada vez
mayor.
Ejemplo:
Para la dsitribucin muestral de medias del ejercicio pasado, encuentre:
El error muestral de cada media
La media de los errores muestrales
La desviacin estndar de los errores muestrales.
Solucin:
En la tabla siguiente se ven las muestras, las medias de las muestras y los errores muestrales:
Muestra x Error muestral, e=x-
(0,0) 0 0 - 3 = -3
(0,2) 1 1 - 3 = -2
(0,4) 2 2 - 3 = -1
(0,6) 3 33=0
(2,0) 1 1 3 = -2
(2,2) 2 2 3 = -1
(2,4) 3 33=0
(2,6) 4 43=1
(4,0) 2 2 3 = -1
(4,2) 3 33=0
(4,4) 4 43=1
(4,6) 5 53=2
(6,0) 3 33=0
(6,2) 4 43=1
(6,4) 5 53=2
(6,6) 6 63=3
La media de los errores muestrales es e, es:
En general se tiene:
Cuando las muestras se toman de una poblacin pequea y sin reemplazo, se puede usar la
formula siguiente para encontrar x .
Ejemplo:
Suponga que la tabla siguiente muestra la antigedad en aos en el trabajo de tres maestros
universitarios de matemticas:
Maestro de matemticas Antigedad
A 6
B 4
C 2
Suponga adems que se seleccionan muestras aleatorias de tamao 2 sin reemplazo. Calcule
la antigedad media para cada muestra, la media de la distribucin muestral y el error
estndar, o la desviacin estndar de la distribucin muestral.
Solucin:
Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras posibles de tamao
2, con sus respectivas medias muestrales.
Muestras Antigedad Media Muestral
A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3
Si utilizamos la frmula del error estndar sin el factor de correccin tendramos que:
Por lo que observamos que este valor no es el verdadero. Agregando el factor de correccin
obtendremos el valor correcto:
El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del
error estndar:
En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con
esta frmula se pueden a hacer los clculos de probabilidad para cualquier ejercicio,
utilizando la tabla de la distribucin z.
Sabemos que cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao
de una poblacin normal, la distribucin muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la formula de la distribucin normal
con y , entonces la frmula para calcular la probabilidad del comportamiento
del estadstico, en este caso la media de la muestra , quedara de la siguiente manera:
Ejemplo:
Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40
horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida
promedio de menos de 775 horas.
Solucin:
Ejemplo:
Las estaturas de 1000 estudiantes estn distribuidas aproximadamente en forma normal con
una media de 174.5 centmetros y una desviacin estndar de 6.9 centmetros. Si se extraen
200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin, determine:
El nmero de las medias muestrales que caen entre 172.5 y 175.8 centmetros.
El nmero de medias muestrales que caen por debajo de 172 centmetros.
Solucin:
Como se puede observar en este ejercicio se cuenta con una poblacin finita y un muestreo sin
reemplazo, por lo que se tendr que agregar el factor de correccin. Se proceder a calcular el
denominador de Z para slo sustituirlo en cada inciso.
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporcin de artculos defectuosos o la proporcin de alumnos
reprobados en la muestra. La distribucin muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin
muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el
estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters
y "n" el tamao de la muestra) en lugar del estadstico media.
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos defectuosos. Se van a
seleccionar 5 artculos al azar de ese lote sin reemplazo. Genere la distribucin muestral de
proporciones para el nmero de piezas defectuosas.
Como se puede observar en este ejercicio la Proporcin de artculos defectuosos de esta
poblacin es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote estn
defectuosas.
El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12 elementos es
12C5=792, las cuales se pueden desglosar de la siguiente manera:
1 4 4/5=0.8 8C1*4C4=8
2 3 3/5=0.6 8C2*4C3=112
3 2 2/5=0.4 8C3*4C2=336
4 1 1/5=0.2 8C4*4C1=280
5 0 0/5=0 8C5*4C0=56
Total 792
A esta frmula se le puede agregar el factor de correccin de si se cumple con las condiciones
necesarias.
Ejemplo:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos.
Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la
proporcin de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solucin:
Este ejercicio se puede solucionar por dos mtodos. El primero puede ser con la
aproximacin de la distribucin normal a la binomial y el segundo utilizando la frmula de la
distribucin muestral de proporciones.
Aproximacin de la distribucin normal a la binomial:
Datos:
n=800 estudiantes
p=0.60
x= (.55) (800) = 440 estudiantes
p(x
Media= np= (800) (0.60)= 480
p(
extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.
Tambin se debe de tomar en cuenta que el factor de correccin de 0.5 se esta dividiendo
entre el tamao de la muestra, ya que estamos hablando de una proporcin.
La interpretacin en esta solucin, estara enfocada a la proporcin de la muestra, por lo que
diramos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa
universidad, la proporcin de estudiantes que fuman cigarrillos sea menor al 55% es del
0.17%.
Ejemplo:
Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden
presentar una reaccin adversa a l, ms an, se piensa que alrededor del 3% de los usuarios
tienen tal reaccin. Si una muestra aleatoria de 150 personas con malestar estomacal usa el
medicamento, encuentre la probabilidad de que la proporcin de la muestra de los usuarios
que realmente presentan una reaccin adversa, exceda el 4%.
Resolverlo mediante la aproximacin de la normal a la binomial
Resolverlo con la distribucin muestral de proporciones
Aproximacin de la distribucin normal a la binomial:
Datos:
n=150 personas
p=0.03
x= (0.04) (150) = 6 personas
p(x>6) =?
Media = np= (150) (0.03)= 4.5
p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer
una muestra de 150 personas, mas de 6 presentarn una reaccin adversa.
Distribucin Muestral de Proporciones
Datos:
n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?
Observe que este valor es igual al obtenido y la interpretacin es: existe una probabilidad del
17% de que al tomar una muestra de 150 personas se tenga una proporcin mayor de 0.04
presentando una reaccin adversa.
Ejemplo:
Se sabe que la verdadera proporcin de los componentes defectuosos fabricados por una firma
es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamao 60 tenga:
Menos del 3% de los componentes defectuosos.
Ms del 1% pero menos del 5% de partes defectuosas.
Solucin:
Datos:
n= 60 artculos
P=0.04
p= 0.03
p(p<0.03) = ?
La probabilidad de que en una muestra de 60 artculos exista una proporcin menor de 0.03
artculos defectuosos es de 0.2327.
Datos:
n= 60 artculos
P=0.04
p= 0.01 y 0.05
p(0.01<p<0.05) = ?
UNIDAD III
ESTIMACION
ESTIMACIN PUNTUAL
La inferencia estadstica est casi siempre concentrada en obtener algn tipo de conclusin
acerca de uno o ms parmetros (caractersticas poblacionales). Para hacerlo, se requiere que
un investigador obtenga datos muestrales de cada una de las poblaciones en estudio.
Entonces, las conclusiones pueden estar basadas en los valores calculados de varias
cantidades muestrales. Por ejemplo, representamos con (parmetro) el verdadero promedio
de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de
semiconductores. Podra tomarse una muestra aleatoria de 10 conexiones para determinar la
resistencia a la ruptura de cada una, y la media muestral de la resistencia a la ruptura se
poda emplear para sacar una conclusin acerca del valor de . De forma similar, si es la
varianza de la distribucin de resistencia a la ruptura, el valor de la varianza muestral s2 se
podra utilizar pra inferir algo acerca de .
Cuando se analizan conceptos generales y mtodos de inferencia es conveniente tener un
smbolo genrico para el parmetro de inters. Se utilizar la letra griega para este
propsito. El objetivo de la estimacin puntual es seleccionar slo un nmero, basados en
datos de la muestra, que represente el valor ms razonable de .
Una muestra aleatoria de 3 bateras para calculadora podra presentar duraciones observadas
en horas de x1=5.0, x2=6.4 y x3=5.9. El valor calculado de la duracin media muestral es =
5.77, y es razonable considerar 5.77 como el valor ms adecuado de .
Una estimacin puntual de un parmetro es un slo nmero que se puede considerar como
el valor ms razonable de . La estimacin puntual se obtiene al seleccionar una estadstica
apropiada y calcular su valor a partir de datos de la muestra dada. La estadstica seleccionada
se llama estimador puntual de .
El smbolo (theta sombrero) suele utilizarse para representar el estimador de y la
estimacin puntual resultante de una muestra dada. Entonces se lee como "el estimador
puntual de es la media muestral ". El enunciado "la estimacin puntual de es 5.77" se
puede escribir en forma abreviada .
Ejemplo:
En el futuro habr cada vez ms inters en desarrollar aleaciones de Mg de bajo costo, para
varios procesos de fundicin. En consecuencia, es importante contar con mtodos prcticos
para determinar varias propiedades mecnicas de esas aleaciones. Examine la siguiente
muestra de mediciones del mdulo de elasticidad obtenidos de un proceso de fundicin a
presin:
44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1
Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la
varianza poblacional . Un estimador natural es la varianza muestral:
Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro slo
que la distribucin muestral de medias tiene una menor varianza, por lo que la media se
convierte en un estimador eficiente e insesgado.
la varianza de T2, se dice que T1 es ms eficiente que T2. Tambin se puede usar la siguiente
relacin
Un estimado puntual, por ser un slo nmero, no proporciona por s mismo informacin
alguna sobre la precisin y confiabilidad de la estimacin. Por ejemplo, imagine que se usa el
estadstico para calcular un estimado puntual de la resistencia real a la ruptura de toallas de
papel de cierta marca, y suponga que = 9322.7. Debido a la variabilidad de la muestra,
nunca se tendr el caso de que = . El estimado puntual nada dice sobre lo cercano que esta
de . Una alternativa para reportar un solo valor del parmetro que se est estimando es
calcular e informar todo un intervalo de valores factibles, un estimado de intervalo o intervalo
de confianza (IC). Un intervalo de confianza se calcula siempre seleccionando primero un
nivel de confianza, que es una medida del grado de fiabilidad en el intervalo. Un intervalo de
confianza con un nivel de confianza de 95% de la resistencia real promedio a la ruptura podra
tener un lmite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un nivel de
confianza de 95%, es posible tener cualquier valor de entre 9162.5 y 9482.9. Un nivel de
confianza de 95% implica que 95% de todas las muestras dara lugar a un intervalo que
incluye o cualquier otro parmetro que se est estimando, y slo 5% de las muestras
producir un intervalo errneo. Cuanto mayor sea el nivel de confianza podremos creer que el
valor del parmetro que se estima est dentro del intervalo.
Una interpretacin correcta de la "confianza de 95%" radica en la interpretacin frecuente de
probabilidad a largo plazo: decir que un evento A tiene una probabilidad de 0.95, es decir que
si el experimento donde A est definido re realiza una y otra vez, a largo plazo A ocurrir
95% de las veces. Para este caso
El 95% de los intervalos de confianza calculados contendrn a .
Esta es una construccin repetida de intervalos de confianza de 95% y se puede observar que
de los 11 intervalos calculados slo el tercero y el ltimo no contienen el valor de .
De acuerdo con esta interpretacin, el nivel de confianza de 95% no es tanto un enunciado
sobre cualquier intervalo en particular, ms bien se refiere a lo que sucedera si se tuvieran
que construir un gran nmero de intervalos semejantes.
Existen varias tablas en las cuales podemos encontrar el valor de z, segn sea el rea
proporcionada por la misma. En esta seccin se realizar un ejemplo para encontrar el valor
de z utilizando tres tablas diferentes.
Ejemplo:
Encuentre el valor de z para un nivel de confianza del 95%.
Solucin 1:
Se utilizar la tabla que tiene el rea bajo la curva de - hasta z. Si lo vemos grficamente
sera:
En base a la tabla que se esta utilizando, se tendr que buscar el rea de 0.975, ya que cada
extremo o cola de la curva tiene un valor de 0.025.
En este caso slo se tendr que buscar adentro de la tabla el rea de 0.475 y el resultado del
valor de z ser el mismo, para este ejemplo 1.96.
Solucin 3:
Para la tabla en donde el rea bajo la curva va desde z hasta :
ESTIMACIN DE LA MEDIA
Es conocido de nosotros durante este curso, que en base a la distribucin muestral de medias
que se gener en el tema anterior, la formula para el calculo de probabilidad es la siguiente:
De esta formula se puede observar que tanto el tamao de la muestra como el valor de z se
conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de
confianza establecido. Pero en ocasiones se desconoce por lo que en esos casos lo correcto
es utilizar otra distribucin llamada "t" de student si la poblacin de donde provienen los
datos es normal.
Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual de la
desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de la poblacin
(s= ).
Ejemplos:
Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de una
muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro.
Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de zinc en
el ro. Suponga que la desviacin estndar de la poblacin es 0.3.
Solucin:
La estimacin puntual de es = 2.6. El valor de z para un nivel de confianza del 95% es
1.96, por lo tanto:
Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo ser ms
amplio:
Solucin:
Con un nivel de confianza del 96% se sabe que la duracin media de los focos que produce la
empresa est entre 765 y 765 horas.
La prueba de corte sesgado es el procedimiento ms aceptado para evaluar la calidad de una
unin entre un material de reparacin y su sustrato de concreto. El artculo "Testing the Bond
Between Repair Materials and Concrete Substrate" informa que, en cierta investigacin, se
obtuvo una resistencia promedio muestral de 17.17 N/mm2, con una muestra de 48
observaciones de resistencia al corte, y la desviacin estndar muestral fue 3.28 N/mm2.
Utilice un nivel de confianza inferior del 95% para estimar la media real de la resistencia al
corte.
Solucin:
En este ejercicio se nos presentan dos situaciones diferentes a los ejercicios anteriores. La
primera que desconoce la desviacin estndar de la poblacin y la segunda que nos piden un
intervalo de confianza unilateral.
El primer caso ya se haba comentado y se solucionar utilizando la desviacin estndar de la
muestra como estimacin puntual de sigma.
Para el intervalo de confianza unilateral, se cargar el rea bajo la curva hacia un solo lado
como sigue:
Esto quiere decir que con un nivel de confianza de 95%, el valor de la media est en el
intervalo (16.39, ).
En este despeje podemos observar que se necesita el valor del parmetro P y es precisamente
lo que queremos estimar, por lo que lo sustituiremos por la proporcin de la muestra p
siempre y cuando el tamao de muestra no sea pequeo.
Ejemplos:
Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias
para evaluar la funcin elctrica de su producto. Todos los reproductores de discos compactos
deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores
tiene como resultado 15 que fallan en una o ms pruebas. Encuentre un intervalo de confianza
de 90% para la proporcin de los reproductores de discos compactos de la poblacin que no
pasan todas las pruebas.
Solucin:
n=500
p = 15/500 = 0.03
Z (0.90) = 1.645
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporcin de discos defectuosos que no
pasan la prueba en esa poblacin esta entre 0.0237 y 0.0376.
En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se encontraron 20
defectuosas.
Si la proporcin p de pilas defectuosas en esa muestra se usa para estimar P, que vendr a ser
la proporcin verdadera de todas las pilas defectuosas tipo B fabricadas por la Everlast
Company, encuentre el mximo error de estimacin tal que se pueda tener un 95% de
confianza en que P dista menos de de p.
Solucin:
p=x/n = 20/400=0.05
z(0.95)=1.96
Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista menos de
0.021 de p. En otras palabras, si p=0.05 se usa para estimar P, el error mximo de estimacin
ser aproximadamente 0.021 con un nivel de confianza del 95%.
Para calcular el intervalo de confianza se tendra:
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se sabe
que la proporcin de pulas defectuosas de esta compaa est entre 0.029 y 0.071.
Si se requiere un menor error con un mismo nivel de confianza slo se necesita aumentar el
tamao de la muestra.
En un estudio de 300 accidentes de automvil en una ciudad especfica, 60 tuvieron
consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de confianza
para aproximar la proporcin de todos los accidentes automovilsticos que en esa ciudad
tienen consecuencias fatales.
Solucin:
P= 60/300 = 0.20
Z (0.90) = 1.645
0.162<P<0.238
UNIDAD IV
INTERVALOS DE CONFIANZA
emprica, un intervalo aleatorio (que depende de experimentos) que contiene a con una
probabilidad alta. La longitud de este intervalo es la que mide la exactitud de la estimacin.
con una misma ley, de esperanza y varianza ambas finitas. Para todo
denotemos por:
Denotemos:
Entonces:
Como el valor de es desconocido no hay ninguna razn a priori para que la desviacin
estndar sea conocida. Si es desconocida, se la estima por la desviacin estndar
emprica . Esta es la razn por la cual damos dos intervalos de confianza. El valor de
se obtiene a partir de un mdulo de clculo numrico. Los valores ms usados son los
siguientes:
reales fijos y el resultado ser verdadero o falso, pero no depender ya del azar.
Lo que podremos decir es que este encuadre (de entre y ) se obtiene como resultado
de un experimento que tenia un porcentaje alto de posibilidades de dar un resultado
verdadero. Para , si repetimos veces la serie de experimentos para obtener
intervalos, podemos esperar que uno de ellos sea falso. Hay que ver un intervalo de
Este no es un caso prctico (no se puede conocer sin conocer previamente ), pero sirve
para introducirnos en el problema de la estimacin confidencial de la media;
Es el mismo caso que el anterior, pero se realiza cuando se observa que hay diferencia notable
en la dispersin de ambas variables.
UNIDAD V
PRUEBAS DE HIPOTESIS
Las secciones anteriores han mostrado cmo puede estimarse un parmetro a partir de los
datos contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador
puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos
problemas de ingeniera, ciencia, y administracin, requieren que se tome una decisin entre
aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el nombre
de hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que
muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la
ingeniera, pueden formularse como problemas de prueba de hiptesis.
Ho; = 50 cm/s
H1; 50 cm/s
La proposicin Ho; = 50 cm/s, se conoce como hiptesis nula, mientras que la proposicin
H1; 50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la hiptesis
alternativa especifica valores de que pueden ser mayores o menores que 50 cm/s, tambin
se conoce como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es
formular una hiptesis alternativa unilateral, como en:
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres
maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces
el objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor
del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o
modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las
especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el
nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del
empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta
informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si
esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse
hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con
certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es
imposible en muchas situaciones prcticas. Por tanto, es necesario desarrollar un
procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad de llegar a una
conclusin equivocada.
TIPOS DE ERROR
Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno por
lo general tiene como resultado un aumento en la probabilidad del otro.
El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I, siempre
se puede reducir al ajustar el o los valores crticos.
Un aumento en el tamao muestral n reducir y de forma simultnea.
Si la hiptesis nula es falsa, es un mximo cuando el valor real del parmetro se aproxima
al hipottico. Entre ms grande sea la distancia entre el valor real y el valor hipottico, ser
menor
NIVEL DE SIGNIFICANCIA
Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuesto a
correr el riesgo de cometern error de tipo I, se llama nivel de significacin.
Esta probabilidad, denota a menudo por se, suele especificar antes de tomar la muestra, de
manera que los resultados obtenidos no influyan en nuestra eleccin.
En la prctica, es frecuente un nivel de significacin de 0,05 0,01, si bien se une otros
valores. Si por ejemplo se escoge el nivel de significacin 0,05 ( 5%) al disear una regla de
decisin, entonces hay unas cinco (05) oportunidades entre 100 de rechazar la hiptesis
cuando debiera haberse aceptado; Es decir, tenemos un 95% de confianza de que hemos
adoptado la decisin correcta. En tal caso decimos que la hiptesis ha sido rechazada al nivel
de significacin 0,05, lo cual quiere decir que tal hiptesis tiene una probabilidad 0,05 de ser
falsa.
Cuando estudiamos ambos valores estadsticos es decir, ambos lados de la media lo llamamos
prueba de uno y dos extremos o contraste de una y dos colas.
Con frecuencia no obstante, estaremos interesados tan slo en valores extremos a un lado de
la media (o sea, en uno de los extremos de la distribucin), tal como sucede cuando se
contrasta la hiptesis de que un proceso es mejor que otro (lo cual no es lo mismo que
contrastar si un proceso es mejor o peor que el otro) tales contrastes se llaman unilaterales, o
de un extremo. En tales situaciones, la regin crtica es una regin situada a un lado de la
distribucin, con rea igual al nivel de significacin.
De lo contrario, no rechazar Ho
No obstante, en la mayor parte de los casos se desconoce la desviacin estndar de la
poblacin. La desviacin estndar se estima al calcular S, la desviacin estndar de la
muestra. Si se supone que la poblacin es normal la distribucin en el muestreo de la media
seguira una distribucin t con n-1 grados de libertad. En la prctica, se a encontrado que
siempre y cuando el tamao de la muestra no sea muy pequeo y la poblacin no este muy
sesgada, la distribucin t da una buena aproximacin a la distribucin de muestra de la media.
La prueba estadstica para determinar la diferencia entre la media de la muestra y la media
de la poblacin cuando se utiliza la desviacin estndar S de la muestra, se expresa con:
Para una muestra de 100, si se selecciona un nivel de significanca de .05, los valores
crticos de la distribucin t con 100-1= 99 grados de libertad se puede obtener como se indica
en la siguiente tabla:
Como esta prueba de dos colas, la regin de rechazo de .05 se vuelve a dividir en dos partes
iguales de .025 cada una. Con el uso de las tablas para t, los valores crticos son 1.984 y
+1.984. la regla para la decisin es:
Rechazar Ho si >+1.984
O si - 1.984
De lo contrario, no rechazar Ho
Los resultados de la muestra para el turno de da fueron =25 430 millas, =4 000 millas
y = 100. Puesto que se esta probando si la media es diferente a 25 000 millas, se tiene con
la ecuacin
Dado que = 1.075, se ve que -1.984 < +1.075 < + 1.984, entonces no se rechaza Ho.
Por ello, la de cisin de no rechazar la hiptesis nula Ho. En conclusin es que la duracin
promedio de las llantas es 25 000 millas. A fin de tener en cuenta la posibilidad de un error de
tipo II, este enunciado se puede redactar como "no hay pruebas de que la duracin promedio
de las llantas sea diferente a 25 000 millas en las llantas producidas en el turno de da".
El concepto de PRUEBA de hiptesis se puede utilizar para probar hiptesis en relacin con
datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fbrica de llantas
quera determinar la proporcin de llantas que se reventaban antes de 10,000 millas. Este es
un ejemplo de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la
proporcin de los valores que tienen una caracterstica particular.
El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo bastante
alta para que muy pocas se revienten antes de las 10,000 millas. Si ms de un 8% de las
llantas se revientan antes de las 10,000 millas, se llegara a concluir que el proceso no
funciona correctamente. La hiptesis nula y alternativa se pueden expresar como sigue:
Ho: p .08 (funciona correctamente)
H1: p > .08 (no funciona correctamente)
= = .05
Y entonces,
= = = = -1.107
UNIDAD VI
La Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar para
solucionar problemas comunes en los negocios.
Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna
Relacin Funcional entre dos o ms variables, donde una variable depende de la otra
variable.
Y = f (X)
"Y est regresando por X"
En ocasiones nos puede interesar estudiar si existe o no algn tipo de relacin entre dos
Variables aleatorias. As, por ejemplo, podemos preguntarnos si hay alguna relacin entre las
notas de la asignatura Estadstica I y las de Matemticas I. Una primera aproximacin al
Problema consistira en dibujar en el plano R2 un punto por cada alumno: la primera
coordenada
De cada punto sera su nota en estadstica, mientras que la segunda sera su nota en
Matemticas. As, obtendramos una nube de puntos la cual podra indicarnos visualmente la
existencia o no de algn tipo de relacin (lineal, parablica, exponencial, etc.) entre ambas
notas.
Otro ejemplo, consistira en analizar la facturacin de una empresa en un periodo de tiempo
dado
y de cmo influyen los gastos de promocin y publicidad en dicha facturacin. Si
consideramos
un periodo de tiempo de 10 aos, una posible representacin sera situar un punto por cada
ao
de forma que la primera coordenada de cada punto sera la cantidad en euros invertidos en
publicidad, mientras que la segunda sera la cantidad en euros obtenidos de su facturacin. De
esta manera, obtendramos una nube de puntos que nos indicara el tipo de relacin existente
entre ambas variables.
En particular, nos interesa cuantificar la intensidad de la relacin lineal entre dos variables. El
Parmetro que nos da tal cuantificacin es el coeficiente de correlacin lineal de Pearson r,
cuyo valor oscila entre 1 y +1:
Est expresado en las mismas unidades de Y por cada unidad de X. Indica el nmero de
unidades en que vara Y cuando se produce un cambio, en una unidad, en X (pendiente de la
recta de regresin).
Un valor negativo de b sera interpretado como la magnitud del decremento en Y por cada
unidad de aumento en X.
BIBLIOGRAFA
1.- LIND, Douglas y MARCHAL, William y MASON, Robert. Estadstica para administracin y
ava
economa. 11 edicin.
2.- BERENSON M. Y D.M. LEVINE, Estadstica para administracin y economa, Mxico:
McGraw Hill. 1991
3.- KAZMIER L. Y A. DIAZ MATA, Estadstica aplicada a la administracin y economa,
Mxico McGraw Hill, 1996, 520 pp.
4.- MENDEHALL W. y J.E. REINMUTH, Estadstica para administracin y economa,
Mxico: Ibero Amrica: 1931, 708 pp.
En Internet: monografas, google, altavista