Está en la página 1de 29

INFERENCIA ESTADISTICA

TEORA ELEMENTAL DE MUESTREO


La teora de muestreo se refiere al estudio de las relaciones que existen entre un
colectivo o poblacin y las muestras que se extraen de las mismas. El estudio de las
muestras permite hacer estimaciones de caractersticas desconocidas de la poblacin
(tales como media, desviacin tpica, proporciones, etc). Estas estimaciones se hacen a
partir del conocimiento de las caractersticas de las muestras (media, desviacin tpica,
proporcin, etc).
Las caractersticas o medidas obtenidas de una muestra se llaman estadsticos; y
las medidas correspondientes a la poblacin parmetros. Cuando una medida muestral
o estadstico es utilizada como representante de una caracterstica poblacional o
parmetro se denomina estimador.

Ventajas de la utilizacin de las muestras

1) El costo es menor y se puede obtener un mejor rendimiento del dinero


invertido.
2) Se obtiene una disminucin notable del tiempo necesario para alcanzar la
informacin
Cuando una muestra posee 30 o ms datos se denomina grandes muestras y si la
muestra tiene menos de 30 observaciones se denomina pequeas muestras.
Al procedimiento utilizado para elegir una muestra se denomina Muestreo.

Necesidad del Muestreo.


1. Poblacin Infinita
2. Poblacin uniforme
3. Proceso de investigacin destructiva
4. Economa de costos
5. Calidad
Muestreo con o sin reemplazamiento:
Con reemplazamiento cuando un elemento de la poblacin puede ser escogido
varias veces para formar parte de la muestra
INFERENCIA ESTADISTICA
Sin reemplazamiento cuando un elemento de la poblacin solo puede ser
seleccionado una sola vez para formar parte de la muestra.
Poblacin: es una coleccin de todos los elementos que estamos estudiando y
acerca de los cuales se intenta extraer conclusiones. Puede ser infinita o finita.
Muestra: Una parte de la poblacin o un subconjunto del conjunto de unidades
obtenidas con el objeto de investigar las propiedades de la poblacin.
Muestreo estadstico: Es un enfoque sistemtico para seleccionar unos cuantos
elementos (una muestra) de un grupo de datos (poblacin) a fin de hacer algunas
inferencias sobre el grupo total. Desde el punto de vista matemtico, podemos
describir las muestras y las poblaciones mediante medidas como la media, la moda,
la desviacin estndar, etc. No es mas que el procedimiento a travs del cual se
obtienen las muestras.

Tipos de muestreo
Muestreo de juicio o no probabilstico. (opintico). Se basa en el conocimiento de la
poblacin por parte de alguien, quien hace a la muestra representativa, dependiendo
de su intencin, por lo tanto es subjetiva.
Probabilstico(Errtico): Todos los elementos de la poblacin tienen la posibilidad
de pertenecer a la muestra.
Muestreo Aleatorio:
1. Muestreo aleatorio simple
2. Muestreo Sistemtico.
3. Muestreo Estratificado
4. Muestreo por Conglomerado
Muestreo de juicio: A travs del conocimiento y la opinin personal, basada en la
experiencia del investigador, se identifican los elementos de la poblacin que van a
formar parte de la muestra. Una muestra seleccionada por muestreo de juicio se basa en
el conocimiento de la poblacin por parte de alguien. Por ejemplo, un guardabosques
tomar una muestra de juicio si decide con antelacin que parte de una gran zona
reforestada deber recorrer para estimar el total de metros de madera que pueden
cortarse. En ocasiones el muestreo de juicio sirve de muestra piloto para decidir cmo
seleccionar despus una muestra aleatoria.
INFERENCIA ESTADISTICA
Muestreo aleatorio: Cuando se conoce la probabilidad de que un elemento de la
poblacin figure o no en la muestra, puede ser:

Muestreo Aleatorio Simple (Irrestrictamente Aleatorio):


Un muestreo es aleatorio cuando cada elemento de la poblacin tiene la misma
probabilidad de ser escogido para formar parte de la muestra. Este tipo de muestreo
evita que la muestra sea sesgada evitando por lo tanto que se realice una mala
inferencia estadstica. Por ejemplo, supngase que un investigador quiera estimar el
mdulo de ruptura promedio de un material determinado formado por una poblacin
de tamao
N = 500; por ser ensayos destructivos este quiere seleccionar una muestra de tamao
n = 10 que le permita realizar la inferencia, ahora bien el criterio que us el
investigador para seleccionar dicha muestra fue el de tomar 10 materiales que estaban
ms prximos a l; evidentemente esta muestra no es representativa de la poblacin, se
dice que esta sesgada, por lo que la inferencia estadstica que se realice ser errnea.
Por lo tanto, una muestra se dice que esta sesgada cuando los elementos seleccionados
tenan mayor probabilidad de pertenecer a la misma.
Cmo hacer el muestreo aleatorio
La forma ms fcil de realizarlo es usando nmeros aleatorios, para esto se puede
recurrir a una tabla o a un generador de nmeros aleatorios. Actualmente, se recurre a
computadora.
Muestreo Sistemtico o Secuencial.
Los elementos se seleccionan de la poblacin con un intervalo uniforme en el

tiempo, en el orden o en el espacio. Por ejemplo, supongamos que se quiere estudiar

una determinada caracterstica de un producto fabricado en serie y se decide

seleccionar a cada veinte producto hasta formar la muestra, para esto se escoge un

punto aleatorio de arranque en los primeros veinte productos y luego se escoge cada

vigsimo producto hasta completar la muestra. Una de las ventajas de este muestreo

es cuando los elementos presentan un patrn secuencial, tal vez requiera menos

tiempo y algunas veces cuesta menos que el mtodo de muestreo aleatorio.


INFERENCIA ESTADISTICA
Muestreo Estratificado.
Para aplicar el muestreo estratificado, se divide la poblacin en grupos
homogneos, llamados estratos, los cuales son hetergeneos entre si. Despus se recurre
a uno de dos mtodos posibles:
a) Se selecciona al azar en cada estrato un nmero especificado de elementos
correspondientes a la proporcin del estrato de la poblacin total
b) Se extrae al azar un nmero igual de elementos de cada estrato y damos un peso a
los resultados de acuerdo a la proporcin del estrato en la poblacin total

El muestreo estratificado es adecuado cuando la poblacin ya est dividida en


grupos de diferentes tamaos y queremos reconocer este hecho. La ventaja de las
muestras estratificadas, es que cuando se disean bien, reflejan ms exactamente las
caractersticas de la poblacin de donde se extrajeron que otras clases de muestreo.

Muestreo por Conglomerado.


En el muestreo por conglomerados, se divide la poblacin en grupos o
conglomerados de elementos heterogneos, pero homogneos con respecto a los
grupos entre si. Un procedimiento bien diseado, de muestreo por conglomerados,
puede producir una muestra ms precisa a un costo mucho menor que el de un
simple muestreo aleatorio. Se usa el muestreo estratificado cuando cada grupo
presenta una pequea variacin en su interior, pero existe una amplia variacin entre
ellos. Se usa el muestreo por conglomerado en el caso contrario, cuando hay
considerable variacin dentro de cada grupo pero los grupos son esencialmente
semejantes entre s.
INFERENCIA ESTADISTICA
DISTRIBUCIONES MUESTRALES
1 DISTRIBUCIN MUESTRAL DE MEDIAS
2 DISTRIBUCIN MUESTRAL PARA DIFERENCIAS DE
MEDIAS
3 DISTRIBUCIN MUESTRAL DE PROPORCIONES Y
DIFERENCIAS
4 DISTRIBUCIN MUESTRAL DE VARIANZAS

Se define la distribucin muestral de un estadstico (distribucin de muestreo) en una

poblacin, como la distribucin de probabilidad de todos los posibles valores que un

estadstico puede asumir para cierto tamao de la muestra. Especficamente, se

trabajar con las distribuciones muestrales para: medias, proporciones y varianzas.

Una distribucin muestral es una distribucin de probabilidad de un estadstico


muestral calculado a partir de todas las muestras posibles de tamao n, elegidas al azar
en una poblacin determinada. Si la poblacin es infinita, tenemos que concebir la
distribucin muestral como una distribucin muestral terica, ya que es imposible sacar
todas las muestras aleatorias posibles de tamao n de una poblacin infinita. Si la
poblacin es finita y moderada se puede construir una distribucin muestral
experimental, sacando todas las muestras posibles de un tamao dado, calculando para
cada muestra el valor del estadstico que nos interesa. Ejemplo, supongamos que se
tiene una poblacin de tamao N = 10 y queremos extraer con reemplazamiento todas
n
las muestras posibles de tamao n = 5, para esto se utiliza la relacin N , es decir,
105 = 100000 muestras de tamao n = 5.

En cambio, si el muestreo es sin reemplazamiento, el nmero de muestras de tamao


N = 5 viene dado por la combinatoria:

N N! 10! 10.9.8.7.6.5!
= = = = 252 muestras.
n n!( N n)! 5!(10 5)1 5!.5.4.3.2.1
INFERENCIA ESTADISTICA
Por lo que considerando este caso, la distribucin muestral para un estadstico
muestra 1 X1
v muestra 2 X2
determinado, por ejemplo, la media X viene dado por:
M
muestra 252 X 252

Esto es, X1 , X 2 , X 3 ,K , X 252 o sea, la distibucin muestral de medias.


Se puede hacer una aproximacin experimental de distribuciones muestrales basadas en
poblaciones infinitas o finitas grandes, sacando un nmero de muestras aleatorias y
siguiendo el mismo procedimiento anterior.
1) DISTRIBUCIN MUESTRAL DE MEDIAS:
Es la distribucin de probabilidad de todas las medias posibles de las muestras,
para un tamao n determinado. Ver ejemplo, anterior. Esta distribucin de
probabilidad tiene asociados (parmetros) tales como la media X y desviacin

estndar X . Para calcular, estos parmetros de la distribucin muestral de medias se


utilizan las siguientes relaciones:

X =
N n
X = para poblacione s finitas
n N 1


X = para poblacione s infinitas
n
La expresin es la desviacin estndar de la distribucin muestral de medias, se le
llama error tpico o estndar de la media y nos indica la diferencia promedio entre los
diversos valores de X y . Como se observa, a medida que el tamao de la muestra
aumenta este error dismunuye, las diversas medias muestrales se hacen ms uniforme
en su valor, y en consecuencia, cualquier media muestral es una buena estimacin de la

media poblacional .
INFERENCIA ESTADISTICA
Distribuciones Muestrales
Construccin
 De una poblacin discreta, finita, de tamao N, extraer todas las muestras posibles de
tamao n
 Calcular el valor del estadstico de inters de cada muestra
 Hacer una tabla con dos columnas: en la primera los posibles valores diferentes del
estadstico y en la segunda, la frecuencia de ocurrencia.

Distribucin Muestral de la Media


Una poblacin consiste de 10 vendedores de una compaa. La variable de inters, X,
es la antigedad.
X = {1, 2, 3, 4, 5, 6, 7, 8, 9,10} Podemos calcular los siguientes

=
x i55
== 5,5
N 10

=
2 ( xi ) 2
= 8,25
N

Distribucin Muestral de la Media

1. Extraemos todas las posibles muestras. Supongamos n=2 (100 muestras).


2. Calculamos la media para cada una de esas muestra x
3. Listar los valores diferentes del estadstico y sus frecuencias.
INFERENCIA ESTADISTICA

Calculamos la media de la distribucin muestral con reemplazamiento

x = n i =
x 550
= 5,5
N 100
Calcular la media muestral sin reemplazamiento?

Calculando la varianza de la distribucin muestral:

x2 =
( xi x ) 2 = 412,5 = 4,125
Nn 100
2
8,25
x2 = = = 4,125
n 2


Error estndar de la media: =
n
INFERENCIA ESTADISTICA
Distribuciones Muestrales
Cuando el muestreo se extrae de una poblacin distribuida normalmente, la distribucin
muestral de la media muestral tiene las siguientes propiedades:
1. La distribucin de la media es normal, independientemente del tamao de la muestra.
2. La Media de la distribucin de las medias es igual a la media de la poblacin.
3. La varianza de la distribucin de las medias es igual a la varianza de la poblacin,
dividida entre n.
Teorema del Lmite Central
Dada una poblacin con media y varianza finita 2, con cualquier distribucin, la
distribucin muestral de la media, calculada de muestras aleatorias de tamao n, est
distribuida normalmente con media y varianza finita 2/n, cuando n es grande.
La regla de oro dice que n30.

Ejemplo
La vida promedia de cierta herramienta es de 41.5 horas, con una desviacin estndar
de 2.5 horas. Cul es la probabilidad de que una muestra aleatoria de tamao 50
extrada de esta poblacin tenga una media entre 40.5 y 42 horas?

P ( 40,5 x 42) = P ( 2,86 z 1,43) = P (0 z 2,86) + P (0 z 1,43) = 0,9215

DISTRIBUCIN MUESTRAL PARA LA DIFERENCIA DE MEDIAS ( X 1 X 2 ).-


A veces interesa hacer inferencias sobre la diferencia poblacional de medias 1 - 2, o
saber si es razonable concluir que dos medias poblacionales no son iguales,
considerando que se tienen sendas muestras para las poblaciones 1 y 2,
respectivamente, donde:

n 1 = tamao de la muestra de la poblacin 1


X 1 = media de la muestra 1
1 = varianza de la poblacin 1
2

n 2 = tamao de le muestra de la poblacin 2


X 2 = media de la muestra 2
22 = varianza de la poblacin 2
Entonces, la diferencia de las medias muestrales X 1 X 2 , estima a 1 - 2. La forma

funcional de la distribucin muestral de X 1 X 2 depende de la forma funcional de las


poblaciones donde se extraen las muestras tomando en cuenta:
- Si ambas poblaciones son normales la distribucin muestral de la diferencia de
medias es normal.
- Si una o ambas de las poblaciones no es normal, la distribucin muestral de las
diferencias de medias X 1 X 2 es normal si n1 + n2 2 >30 (grandes muestras),
este resultado se deduce del teorema del lmite central
INFERENCIA ESTADISTICA
En estos casos, los parmetros que definen esta distribucin muestral de las diferencias
de medias vienen dados por:
X1 X 2
= 1 2

2
2

X1 X
= 1
+ 2

n1 n2

El cual se aplica para dos casos especficos dependiendo de la muestra:


a) Para grandes muestras, cuando v = n1+n2 - 2 > 30, se trabaja con la
distribucin normal. En estos casos, estandarizando la diferencia de medias
muestrales, se tiene:

( X 1 X 2 ) ( 1 2 )
Z=
12 22
+
n1 n2

b) Para pequeas muestras, Cuando v = n1 + n2 2 < 30, se trabaja con la


Distribucin t de Student. Por lo tanto, el valor viene dado por:

( X 1 X 2 ) ( 1 2 )
t=
2 2
Sp Sp
+
n1 n2

donde:

(n1 1) S1 + (n2 1) S 2
2 2

Sp =
2

n1 + n2 2
INFERENCIA ESTADISTICA
Ejemplo
Dos compaas fabrican lubricantes de alta temperatura, para el mismo mercado. La
compaa A anuncia que en promedio, su lubricante deja de ser efectivo a 505 F, con
una desv. est. de 10 F. La compaa B anuncia que su producto tiene una media de 475
F, con una desv. est. de 7 F. Suponga que una muestra de tamao 20 para la primera
compaa y otra independiente de tamao 25 para la segunda son extradas
aleatoriamente. Cul es la probabilidad de que la diferencia en temperatura promedio
de falla para las dos muestras est entre 25 y 35 F?

)
DISTRIBUCIN DE UNA PROPORCION MUESTRAL ( P ).-
Se define una proporcin muestral como el cociente:
nmero de casos favorables
p=
total de casos
Por ejemplo: si de una poblacin de N = 50, empleados de una empresa,

15 de ellos no cumplen con su horario de trabajo, la proporcin de empleados que no

cumplen horario con relacin al total, viene dado:

P = 15/50 = 0,3; es decir, el 30 % de los empleados no cumplen su horario.


La proporcin muestral ( p ), se define como:
nmero de casos favorables
p =
tamao de la muestra
Ejemplo:
Si se toma una muestra aleatoria de tamao n = 1000 y 425 personas satisfacen
un evento, entonces p = 425 / 1000 = 0,425. Esto significa que el 42,5 % de las
personas satisfacen dicho evento.
INFERENCIA ESTADISTICA
La distribucin de una proporcin muestral, se define de una manera anloga a a la
distribucin de media, o sea:
Muestra 1---- p1

Muestra 2---- p2
Muestra 3---- p3

Muestra 252---- p252

De esta forma: p1 , p2 , p3 ,..., p252 corresponden a la distribucin de una


proporcin muestral.
De acuerdo a lo expuesto, la distribucin muestral de proporciones corresponde a una
distribucin de probabilidad de todas las proporciones posibles de las muestras, para un
tamao n determinado.
Los parmetros que definen esta distribucin vienen dados por:
p = p = P
p.q N n
X = para poblacione s finitas
n N 1

p.q
X = para poblacione s infinitas
n
Para el clculo de probabilidades relativa a proporciones, se trabaja de manera
anloga al caso de la distribucin muestral de medias.
Ejemplo: Un encuestador sabe que en cierta rea el 20 % est a favor de las emisiones
en bonos. Considerando una muestra de 64 personas, hallar la probabilidad de que la
proporcin muestral difiera de la proporcin real a lo sumo en un 0,06.
Solucin:
p = 0.20 proporcin de personas de la poblacin que estn a favor de la emisin
p = proporcin de personas de la muestra que estn a favor de la emisin

entonces nos estn pidiendo la siguiente probabilidad:




p p
P ( p p 0,06) = P
0,06
= P ( 0,27 Z 0,27 ) = 0,20 4
0,06

0,2.0,8 p.q 0,2.0,8

64 n 64
INFERENCIA ESTADISTICA
ESTIMACION DE PARAMETROS
a) ESTIMACIN PUNTUAL
Para estimar un parmetro de una poblacin se toma una muestra representativa

de la misma y se calcula el estadstico , el valor del estadstico se conoce como la


estimacin puntual del parmetro . Por ejemplo,

Parmetro Estimacin puntual


= = X (media muestral)
= = S (varianza muestral)
=p = p (proporcin muestral)
= 1 2 X 1 X 2 (diferencia muestral de medias)

b) ESTIMACIN POR INTERVALOS DE CONFIANZA


En la seccin anterior se habl sobre la estimacin puntual, una de sus desventajas
es el hecho de no saber que tan prxima est del parmetro, es decir, cuando se obtiene

una estimacin , a partir de una muestra aleatoria de tamao n, se desconoce que tan

cerca (por defecto o exceso) est del parmetro a estimar . Por eso se utiliza
frecuentemente otro tipo de estimacin, la estimacin por intervalos, la cual nos
permite de acuerdo a un nivel de confianza especificado obtener una informacin ms
precisa sobre el parmetro a estimar.

1. Intervalo de confianza para medias con n 30 (grandes muestras):


x z / 2 , x + z/2
n n es una estimacin por intervalo de la media de la

poblacin para un nivel de confianza del (1-)%; por ejemplo, si se define un nivel de
confianza del 95 %, esto significa que por cada 100 muestras de tamao n 30 en 95
de ellas la media de la poblacin cae dentro de este intervalo.
INFERENCIA ESTADISTICA
Intervalo de confianza para medias con n < 30 (pequeas muestras):
Se utiliza la t de Student para estos casos y cuando se desconoce la desviacin de la
poblacin, utilizando la siguiente expresin:

S S
x t / 2 , x + t/2
n n

Es una estimacin por intervalo de la media de la poblacin para un nivel de confianza


del (1-)%.

Intervalo de confianza para diferencias de medias (1 - 2 ):


a) si n >30 (grandes muestras) se usa la distribucin normal:

(1 - 2) ( X X ) Z . 1 + 2 , ( X X ) + Z . 1 + 2
2 2 2 2


1 2
n1 n2
1 2
n1 n 2
2 2

b) si n < 30 (pequeas muestras) se usa la t de Student:

2 2 2 2
(X X ) t . S p + S p , (X X ) + t . S p + S p
(1 - 2) 1 2
n1 n2
1 2
n1 n2
2 2

para un nivel de confianza del (1 - )% y v = n 1 + n 2 2 g.l.

(n 1) S1 + (n2 1) S 2
2 2

donde S p = 1
2

n1 + n2 2
Intervalo de confianza para proporciones ( p ):
a) grandes muestras:
p.q p.q
p p Z . , p + Z .
2
n 2
n
INFERENCIA ESTADISTICA
b) pequeas muestras:

p.q p.q
p p t . , p + t .

2
n 2
n

Intervalo de confianza para varianzas:



(n 1) S 2 (n - 1)S 2

2
,
2
2

2
1-
2

Ejemplos:

1. Un fabricante de monitores prueba dos diseos de microcircuitos para


determinar si producen un flujo de corriente equivalente:
Diseo 1 n1= 18 X 1 =24.2 S12 = 10

Diseo 2 n2 =20 X 2 =23.9 S22 = 20


Hallar un intervalo de confianza con un nivel de confianza del 98 % para:

a) el flujo medio del diseo 1 y diseo 2.


b) La diferencia media del flujo entre los dos diseos.
c) La variabilidad del diseo 1 y diseo 2.
Solucin:

a) para un nivel de confianza del 98 % se tiene que = 1 0,98 = 0,02 y /2 =


0,01.
- diseo1, como n = 18 < 30, entonces para v = 17 grados de libertad se tiene
que t = t 0.01 = 2.567 y se emplea la frmula
2

S
= (20.38 , 26.11)
S 3.16 3,16
x t / 2 , x + t /2 = 24.2 2.567. , 24.2+ 2.567
n n 18 18

Esto significa, que por cada 100 muestras de tamao n =18 en 98 de ellas la media
poblacional cae dentro de este intervalo.
INFERENCIA ESTADISTICA
- diseo 2, como n = 20 < 30, para v = 19 g.l. se tiene que t = t 0.01 = 2.539 por lo
2

tanto
S
= (21.661 , 26.739)
S 4.47 4,47
x t / 2 , x + t /2 = 24.2 2.539. , 24.2+ 2.539
n n 20 20

b) para la diferencia de flujo medio (1 - 2 ), como n = 18+20 2 = 36 > 30 , se tiene


que Z = 2.33 y se utiliza la frmula
2

2
(1 - 2) ( X 1 X 2 ) Z . 1 + 2 , ( X 1 X 2 ) + Z . 1 + 2
2 2 2

n1 n2 n1 n2
2 2

10 20
= (0.3 - 2.90 , 0.3 + 2.90 ) = ( 2.6 , 3.2 )
10 20
( 24.2 23 .9 ) 2.33. + , ( 24.2 23 .9 ) + 2.33. +
18 20 18 20

Se concluye que por cada 100 muestras de tamao n1 =18 y n2 =20 en 98 de


ellas la diferencia de medias poblacionales (1 - 2 ) est dentro de este
intervalo.
c) diseo 1, con v = 17 g.l. se tiene 2 = 02.01 = 33,41 y 2 = 02.99 = 6,41
1-
2 2

usando la relacin:

(n 1) S 2 (n - 1)S 2 17.10 17 .10
2
, = , = (5.09 , 26.52)
2
2
33,41 6,41
2
1-
2
Por cada 100 intervalos de tamao n = 18 en 98 de ellos la varianza poblacional 2 cae
dentro de este intervalo.
INFERENCIA ESTADISTICA
PRUEBA DE HIPTESIS

Para probar una hiptesis relativa a un parmetro se debe proceder de la siguiente


manera:

Definir la hiptesis nula H0 : (se considera la aseveracin del fabricante)


H0: = 0

2. Establecer la hiptesis alternativa:

Ha: 0 (prueba de dos colas o bilaterales)

Ha: > 0 (prueba de cola derecha o unilateral)

Ha: < 0 (prueba de cola izquierda o unilateral)

Nota: La hiptesis alternativa se escoge de acuerdo a cada problema en particular.

Por ejemplo: supongamos que un fabricante de bombillos asegura que su producto


tiene una duracin promedio de 2000 horas. Por lo que el dueo de una ferretera
quiere contrastar esta aseveracin. Para esto se deben definir la hiptesis nula y
alternativa:

H0: = 0 = 2000 h

Ha: < 0 =2000 (prueba de cola izquierda)

Se selecciona esta hiptesis alternativa ya que si la duracin promedio es mayor


que 2000 h, entonces esta hiptesis no es antagnica con H0, es decir, es mejor para el
dueo de la ferretera.

3. Definir el nivel de significacin:

Para realizar una prueba de hiptesis relativa a un parmetro, se debe fijar el nivel
de confianza (1-) % , de aqu definimos el nivel de significacin como el valor de .
Si el nivel de confianza es del 95 %, 1- = 0,95 de donde =0,05.
INFERENCIA ESTADISTICA
Calcular el Estadstico de Prueba:

HIPOTESIS NULA ESTADISTICO DE PRUEBA


H0: = 0 (para medias) Grandes muestras Pequeas muestras

x x
z= t=
S
n n

H0: 1 - 2 = 0 (diferencia de medias) Grandes muestras

( x1 x2 ) ( 1 2 )
z=
12 22
+
n1 n2

Pequeas muestras

( x1 x 2 ) ( 1 2 )
t=
S p2 S p2
+
n1 n2

H0 : 2 = 02 (para varianzas) (n 1) S 2
2 =
2

H0 : 12 = 22 (igualdad de varianzas) (nM 1) S M2


F=
(nm 1) S m
S M2 : var ianza mayor
S2m : varianza menor

H0 : P = P 0 (para proporciones) p p
z=
p
p.q
p = p P =
n

H0 : P1 P2 = 0 (diferencia de
proporciones)
INFERENCIA ESTADISTICA
INFERENCIA ESTADISTICA

ya que el rea de las colas est muy cercana a cero (0,0000892649) entonces
los valores de < 0,0000892649 permiten aceptar la hiptesis nula; por lo que
el valor p = > 0,0000892649 permiten rechazar H0. Por lo tanto, es evidente
que para niveles de significacin del 1% ( =0,01), 5% (=0,05),10% (=0,1)
se rechaza H0. En conclusin se rechaza la hiptesis nula de que la
conductividad trmica del ladrillo es igual a 0,36; es decir, se acepta la
alternativa de que es diferente.
INFERENCIA ESTADISTICA

2. Se analizan dos catalizadores para determinar la forma en que se afectan el


rendimiento medio de un proceso qumico. De manera especfica el catalizador
1 es el que se est empleando en este momento, pero el catalizador 2 es ms
econmico. Los datos de rendimiento de un catalizador se muestran a
continuacin:

Catalizador 1 91.5 94.18 92.18 95.39 91.79 89.07 94.72 89.21

Catalizador 2 89.19 90.95 90.46 93.21 97.19 97.04 91.07


92.75
Existe alguna diferencia entre los rendimientos medios. Hallar el valor p.
Explique sus conclusiones.
Solucin:
- formulacin de hiptesis
H0: 1 - 2 = 0
Ha: 1 - 2 0
- clculo del estadstico de prueba
primero se calculan los estadsticos para la poblacin 1 y 2
x1 = 92,255 S12 = 2,39
respectivamente:
x 2 = 92,7325 S 22 = 2,98

7 . 2,39 + 7 . 2,98
luego S p2 = = 2,69 , entonces se tiene que:
14

( x1 x 2 ) ( 1 2 ) - 0,1775
t= = = 0,6725
S p2 S p2 2,69 2,69
+ +
n1 n2 8 8
INFERENCIA ESTADISTICA

El valor p nos define los para el cual se rechaza H0. Considerando v = 14 g.l.
y el estadstico = -0,67 como valor crtico, se tiene que el rea a la izquierda de
0,67 y a la derecha de 0,67 es igual a 0,255. Por lo que, el valor p = >
0,255, en consecuencia, la hiptesis nula se rechaza para > 0,255. De
manera particular, se tiene que para los valores usuales de = 0,01, =0,05 y
= 0,1. La hiptesis nula H0 no se rechaza (se acepta). Por tanto, se concluye
que para estos niveles de significacin la diferencia del rendimiento medio no
es estadsticamente significativa.
Tamao de la Muestra.
La clave del problema estriba en escoger una muestra cuyo seleccin
garantice la representatividad de la poblacin objeto de estudio. En los
estudios socio-econmicos, una muestra de un 30% de la poblacin, tiene un
elevado nivel de representatividad (Ramrez 1995); sin embargo, esta
representatividad depende mayormente, del tipo de muestreo. Obviamente,
que el trabajar con muestras, por muy confiables que sean, no se obtiene el
100% de exactitud, sin embargo, ese pequeo error que acompaa siempre a
los estudios por muestreo, es compensado con el tiempo y costo ahorrado al
trabajar con grupos pequeos en vez de toda la poblacin.

Determinacin del Tamao de la Muestra en una poblacin, cuando se


utilizan proporciones:

2
Z

n= 2 . p.q


Donde:
n: Tamao de la muestra
Z/2: Valor terico en funcin del nivel de confianza, para 99 %,
Z/ 2 = 2,56 y para el 95%, Z/2 =1,96
: error de muestreo
P: Nmero de veces que se produce un evento en %
Q: Es el porcentaje complementario de P
Ejemplo:
Opinin de los electores sobre gestin de gobierno.
Se realiz un estudio piloto de 150 electores donde 60 opinan
favorablemente. A cuantas personas es necesario encuestar si se desea un
nivel de confiabilidad de 99 % y un error de muestreo +/- 1.5%.

Entonces se tiene:

2
Z

n= 2 . p.q El valor de P viene dado por:

P = 60 / 150 X 100 = 40%, por lo tanto Q = 100 - 40 = 60%.

2
2,56
De esta forma se tiene: n = . 0,4. 0,6 = 6.991 . Es necesario
0,015
encuestar a 6.991 personas para alcanzar cierta confiabilidad en los
resultados.

En el caso de una Poblacin Infinita con 95 % de Confiabilidad.

Utilizando el ejemplo anterior, se tiene:


2
1,96
n= . 0,4. 0,6 = 4098
0,015

Al bajar el coeficiente o el nivel de confiabilidad, tambin baja el tamao de


la muestra.
INFERENCIA ESTADISTICA
En el caso de que no exista un Estudio Piloto.

A los valores de P y Q se les asigna el valor de 50% a cada uno y es lo que


se denomina Condiciones desfavorables de muestreo. En el caso del
ejemplo citado el tamao de la muestra viene determinado de la siguiente
manera:

2
1,96
n= . 0,5. 0,5 = 4.268
0,015
Esto quiere decir que habr que encuestar a 4.268 personas.

En el caso de poblaciones finitas, el modelo matemtico difiere con el de


las poblaciones infinitas:
Z / 2 . p.q.N
n=
( n 1) + Z / 2 . p.q
2

Donde: N es el tamao de la poblacin y n el tamao de la muestra.

Se puede aplicar en el siguiente caso: Conocer la opinin de los


miembros de un sindicato, ante un nuevo contrato colectivo. Compuesto por
3.257 obreros. Cuntas obreros se deben entrevistar para obtener un nivel
de confianza de 99 % y un error de muestreo de +/- 3%, en condiciones
desfavorables?
2,562 . 0,5 . 0,5. 3257
n= = 1.168
0,032 (3257 1) + 2,562.0,5.0,5

Se requieren encuestar a 1.168 obreros, para lograr cierto grado de


Confianza.
INFERENCIA ESTADISTICA
Determinacin del Tamao de la Muestra en una poblacin para medias.
En este caso se utiliza la relacin:

Z .
2


n= 2


Ejemplo: Se quiere estudiar la vida til media de una marca de neumticos.
Si sabe por estudios anteriores que la desviacin estndar es de 800 Km .
Determinar el tamao de la muestra requerido para un nivel de confianza
del 95 %, fijando un error de 40.
Sustituyendo los valores se tiene
2 2
1,96. 800 1568
n= = = 1536,64 1537 neumticos
40 40

En conclusin, la validez en la investigaciones de negocios, est muy


relacionada con la confiabilidad del muestreo y una muestra confiable est
en funcin del tipo de poblacin a estudiar ( finitas o infinitas); asi mismo,
en cuanto al nivel de confiabilidad, sta ser mayor si la muestra es mayor
y en relacin al error de muestreo, ste ser menor cuando la muestra es
mayor. Para determinar el tamao de la muestra de una forma mas rpida
y prctica, se han diseado las Tablas de Harvard, las cuales permiten
calcular, rapidamante el tamao de la muestra a tomar, en funcin del error
de muestreo, niveles de confiabilidad y posibles valores de P y Q.

Para profundizar en este aspecto de muestreo, se recomienda consultar


los textos especializados en estas reas. Pues una vez determinado el
tamao de la muestra el paso siguiente que se plantea es lo relacionado al
tipo de muestreo que se va a utilizar para escoger los elementos que
integran a la muestra y sto es un amplio e interesante tema a tratar.
INFERENCIA ESTADISTICA
AJUSTES DE CURVAS.
Cuando se quiere estudiar la relacin entre variables se puede recurrir a dos
tipos de modelos:
a) modelo determinstico, la relacin viene definida a travs de una frmula. Por
ejemplo, sea y = x2, entonces se dice que y est en funcin de x, donde y se conoce
como variable dependiente y x variable independiente. La caracterstica
fundamental de este modelo es que para un valor particular de x siempre obtenemos
el mismo resultado en y, esto significa que la relacin entre las variables es perfecta.
Ver grfica.

b) modelo probabilistico, la relacin entre las variables no es perfecta, ya que debido a


una perturbacin aleatora (ruido) a veces para un mismo valor de la variable
independiente x se obtienen valores diferentes para y. En este caso, no se obtiene una
curva sino un diagrama de dispersin. Considerando el ejemplo anterior, y = x2 +
donde es un ruido. Ver grfica.

Por tanto, los modelos probabilsticos son tiles cuando se realizan


investigaciones del tipo experimental donde a pesar de mantener fijo los valores de la
variable independiente ocurren fluctuaciones debido fundamentalmente a errores de
medicin, de los equipos, etc. En el presente trabajo estamos interesados en este tipo de
modelos. A continuacin mencionamos los modelos de ajustes ms usados:
INFERENCIA ESTADISTICA
Regresin simple: Se define como la curva que optimiza (minimiza), mediante el
mtodo de los mnimos cuadrados, los saltos o fluctuaciones de los datos. Es decir, es la
curva que mejor ajusta los valores del diagrama de dispersin convirtiendo el modelo
probabilstico en un modelo determinstico con la finalidad de realizar predicciones. De
igual forma, la curva de regresin permite modelar la tendencia de los valores. Los
modelos de regresin simple vienen definidos por y = f(x)+. A continuacin veamos
los distintos modelos con su respectivo ajuste o curva de regresin:

Modelos Probabilsticos Curva de Regresin


INFERENCIA ESTADISTICA
INFERENCIA ESTADISTICA

También podría gustarte