Está en la página 1de 111

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA


UNIDAD DE CIENCIAS BSICAS






Actualizacin

JEAMMY JULIETH SIERRA HERNNDEZ
(Director Nacional de Curso)





100403 INFERENCIA ESTADSTICA
Vol. 1




Autor Primera Edicin
JORGE RONDON
DANIS BRITO


Evaluador
EMERSON CHAPARRO






IBAGU
JUNIO 2012
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

2



COMITE DIRECTIVO

Jaime Alberto Leal Afanador
Rector


Constanza Abada Garca
Vicerrectora Acadmica y de Investigacin



Gloria Herrera
Vicerrector de Medios y mediaciones Pedaggicos



Maribel Crdoba Guerrero
Secretaria General







Inferencia Estadstica

Tercera Versin

Copyright
Universidad Nacional Abierta y a Distancia



ISBN



2012

Unidad de Ciencias Bsicas UNAD
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

3



CAMPOS DE
FORMACIN
Bsica CRDITOS: 2 TRABAJO INDEPENDIENTE: 72
Horas
TIPO DE CURSO Terico CDIGO:100403 ACOMPAAMIENTO TUTORIAL: 24
Horas
OBJETIVO GENERAL:
Que el estudiante comprenda, aplique y desarrolle la teora y las tcnicas de la
inferencia estadstica en diversos campos de su saber formativo, y que dicha
aplicacin se convierta en una herramienta de uso matemtico para la toma de
decisiones sobre hiptesis cuantitativas de datos, basado en la informacin
extrada de una muestra.

OBJETIVOS ESPECFICOS:
- Que el estudiante identifique las tcnicas y procedimientos que se
deben emplear para que las muestras sean representativas de la poblacin
que se pretende estudiar, de forma que los errores en la determinacin de
los parmetros de la poblacin objeto de estudio sean mnimos.

- Que el estudiante comprenda el comportamiento de una poblacin a
partir del anlisis metdico de una muestra aleatoria de la misma, y que
entienda que la inferencia inductiva de los parmetros estadsticos que
estime sobre dicha muestra, conlleva un error, el cual es posible de ser
cuantificado.

- Conocer los criterios tcnicos que hay que tener en cuenta antes
de seleccionar un tamao de muestra.

- Identificar el tipo de muestreo de acuerdo a los objetivos del estudio.

- Diferenciar y analizar las ventajas y desventajas de la estimacin
por intervalos de confianza y las pruebas de hiptesis.

- Determinar la prueba o tcnica apropiada a aplicar en las diferentes
pruebas de hiptesis paramtricas y No paramtricas.

COMPETENCIA GENERAL DE APRENDIZAJE:

Identificar un procedimiento adecuado para seleccionar de una poblacin una
parte de ella, con el fin de obtener resultados confiables y poder generalizar los
resultados obtenidos a toda la poblacin.
Determinar los estadsticos necesarios para el anlisis y solucin de situaciones
que implican conjuntos de datos de su disciplina de formacin, por medio del
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

4


conocimiento de la teora elemental del muestreo y de las distribuciones
muestrales.

Plantear y desarrollar el proceso de la inferencia estadstica para resolver
problemas concretos de investigacin en el mbito de otras disciplinas.

Aplicar apropiadamente los resultados tericos y metodolgicos de la inferencia
estadstica de estimacin y prueba de hiptesis en el marco de la modelacin.

Habilidad para planear una investigacin, diseo de instrumentos, definicin de
variables, recoleccin de la informacin, resumen y presentacin de los datos.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

5



UNIDADES DIDCTICAS

INTRODUCCIN ................................................................................................................................... 6
UNIDAD UNO: ...................................................................................................................................... 7
MUESTREO, DISTRIBUCIN MUESTRAL E INTERVALOS DE CONFIANZA ............................................. 7
CAPITULO UNO: PRINCIPIOS DE MUESTREO ................................................................................... 8
Leccin No 1: Conceptos Bsicos .............................................................................................. 10
Leccin No 2: Tipos de muestreo y seleccin de muestra ........................................................ 15
Leccin No 3: Tipos de Seleccin de Muestras ......................................................................... 30
Leccin No 4: Mtodos de Inferencias, Paramtrico y No Paramtrico ................................... 31
Leccin No 5: Estimadores y propiedades de los estimadores ................................................. 34
................................................................................................................................................... 36
CAPITULO DOS: DISTRIBUCIONES MUESTRALES ........................................................................... 37
Leccin No 6: Distribuciones Muestrales .................................................................................. 38
Leccin No 7: Distribucin Muestral de la Media y de la Proporcin ....................................... 40
Leccin No 8: Distribucin Muestral de la proporcin.............................................................. 58
Leccin No 9: Distribucin Muestral de Diferencias de Medias y de la Proporciones .............. 63
Leccin No 10: Tamao de la muestra para estimar la media, la proporcin y el total de la
Poblacin ................................................................................................................................... 67
CAPITULO TRES: INTERVALOS DE CONFIANZA .............................................................................. 74
Leccin No 11: Nociones Fundamentales. ................................................................................ 75
Leccin 12. Intervalos de confianza para medias y diferencias de medias con muestras
pequeas
30 n
..................................................................................................................... 80
Leccin 13. Intervalos de confianza para la media y diferencias de medias muestras grandes
30 > n ...................................................................................................................................... 99
Leccin 14. Intervalos de confianza para la proporcin y diferencias de proporciones (siempre
son muestras grandes) 30 > n .............................................................................................. 103
Leccin 15. Intervalos de confianza para la varianza poblacional. ......................................... 105




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

6


INTRODUCCIN


El presente modulo est dirigido a estudiantes de programas de pregrado que
oferta la UNAD, bajo la modalidad de educacin superior a distancia.

El material est estructurado en dos unidades que son las temticas macro del
curso acadmico.

El contenido de cada una de las partes fue seleccionado, teniendo en cuenta los
saberes mnimos que se esperara debe alcanzar un estudiante de la
Universidad Nacional Abierta y a Distancia en el campo de la Inferencia
estadstica.

La propuesta permite que los estudiantes reconozcan los conocimientos
mnimos del curso en mencin, que le permita resolver situaciones propias del
mismo y adems, abordar posteriores temticas que requieran de stos
conocimientos.

Para el mejor aprovechamiento de este material, se recomienda que el estudiante
posea como conocimientos previos: de estadstica descriptiva y de la teora de
probabilidad.

El modulo se caracteriza porque en cada leccin se presentan ejemplos
modelos del tema en estudio, al final de cada captulo se exponen ejercicios con
respuesta, que permite a los estudiantes contextualizarse en diversas reas del
conocimiento, con el fin de fortalecer las temticas propias del curso.

Al final de cada unidad se presenta una Autoevaluacin de un nivel medio-alto, las
cuales permiten verificar los alcances de los estudiantes en las temticas
analizadas y detectar las debilidades y as centrarse en stas, con el fin de
alcanzar las metas propuestas.

Finalmente, el Material pretende servir como gua de aprendizaje autnomo, se
recomienda apoyar este proceso por medio de lecturas especializadas, ayudas
audiovisuales, visitas a sitios Web y prcticas de laboratorio; entre otros, as
lograr una efectiva comprensin, y aplicacin de las temticas estudiadas.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

7













UNIDAD UNO:
MUESTREO, DISTRIBUCIN MUESTRAL E INTERVALOS DE CONFIANZA
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

8


CAPITULO UNO: PRINCIPIOS DE MUESTREO

Introduccin
En los estudios de investigacin lo primero que se define es el fenmeno a
analizar, luego la poblacin objeto de estudio, la cual puede ser finita cuando
se conocen todos los elementos, o infinita cuando no se conocen todos
los elementos de la misma. Desde estos puntos de vista analizar la poblacin
no es prctico, por tiempo y costos, lo que induce a seleccionar una
muestra, cuya importancia radica en el proceso de consecucin de
datos que proporcionan la informacin suficiente y necesaria a cerca de
la poblacin, adems que con la muestra se estn utilizando menos recursos,
debido a que slo una parte de la poblacin se encuentra bajo observacin,
lo que resulta significativamente beneficioso sobre todo cuando se trata
de poblaciones grandes y dispersa.

Otro aspecto que justifica la decisin de tomar una muestra es en casos donde
se debe destruir los elementos de sta, por ejemplo cuando se desea
identificar el grado de vaco de un producto enlatado, la resistencia de un
material y otros.

En las encuestas de opinin sobre la preferencia de un producto se nota ms
claramente la utilidad de una muestra en contraste con la poblacin,
para conocer las preferencias de los consumidores y poder acomodar
rpidamente el sistema de produccin a dichos cambios.

En desarrollo del presente modulo, se utiliza la coma para indicar la parte decimal
de un nmero.












UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

9




Objetivo general

Que los estudiantes identifiquen los principios sobre poblacin y
muestra, mtodos de muestreo, distribucin de muestreo para medias,
el teorema central del lmite, aplicados al clculo de tamaos de muestras
pertinentes.


Objetivos especficos

- Comprender los conceptos de poblacin y muestra.
- Identificar los diferentes diseos de muestreo y su utilidad en
diferentes campos del saber.
- Conceptuar una distribucin muestra y calcular las estimaciones
requeridas, la varianza y el error de estimacin para los mismos.
- Conocer y comprender los elementos del teorema central de
lmite y su utilidad.
- Determinar un tamao de muestra representativo tanto para medias
como para proporciones.
- Realizar aplicaciones en Excel y SPSS.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

10


Leccin No 1: Conceptos Bsicos

Dentro de la inferencia estadstica, el proceso de muestreo permite que a
partir de los resultados obtenidos al analizar una muestra, se pueda obtener
conclusiones en cuanto a una o varias de las caractersticas o parmetros de una
poblacin. Esta rea de la Estadstica, ayuda a determinar la confiabilidad de la
inferencia de que los fenmenos observados en la muestra ocurrirn tambin
en la poblacin de donde se selecciona la muestra. Es decir, sirve para
estimar la eficacia del razonamiento inductivo con el cual se infiere que lo
observado en una parte ser equivalente a lo observado en la poblacin.

Las tcnicas de muestreo son importantes en la medida que se utilice en
forma adecuada para la situacin que se requiera. De las tcnicas ms
conocidas y utilizadas se tienen el Muestro Aleatorio Simple (M.A.S), Muestreo
Aleatorio Estratificado (M.A.E), Muestro Sistemtico (M.S) y Muestreo por
Conglomerados (M.C). Se tratar de analizar estas tcnicas, especialmente el
M.A.S y M.A.E.

El xito en el desarrollo del curso en mencin est en los buenos
conocimientos previos en Estadstica Descriptiva, Probabilidad y, algebra,
Trigonometra y Geometra analtica. Lo anterior debido a que se debe predecir
resultados o tomar decisiones que tienen un grado de incertidumbre o un
grado de error que se debe definir de antemano.

1.1. Poblacin Y Muestra

Existe una serie de trminos estadsticos bsicos, que son muy utilizados y se
requiere sean comprendidos para avanzar en otros temas o unidades, en
esta seccin se tratarn los conceptos de poblacin y muestra.

Poblacin Universo: Se considera a todo aquello sobre el que se
desea hacer un estudio estadstico. Segn el nmero de unidades,
elementos o casos que la constituyen, la poblacin puede ser finita o infinita.

Poblacin Finita: Es aquella conformada por un determinado o limitado nmero
de elementos.

Poblacin Infinita: Es aquella conformada por un determinado o limitado
nmero de elementos.
Cuando el nmero de unidades que integra una poblacin es muy grande, se
puede considerar a sta como una poblacin infinita. El investigador define la
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

11


poblacin objeto de estudio en trminos de espacio y tiempo, ya que de esta
manera los resultados sern sobre la poblacin definida en el espacio
demarcado y en el tiempo definido.

Ejemplo

Estudiantes del Programa de Ingeniera de Sistemas
Estudiantes del programa de Ingeniera de sistemas de la UNAD
Estudiantes del programa de Ingeniera de sistemas en la UNAD de los
aos
2.010, 2.011 y 2.012

Muestra: Se considera una muestra al subconjunto representativo de la
poblacin, que ha sido seleccionada de manera tcnica mediante un
procedimiento denominado diseo de muestreo, para garantizar que dicha
muestra es representativa de la poblacin, es decir, que las unidades
seleccionadas en la muestra mediante un proceso aleatorio, hayan tenido
igual probabilidad de haber sido seleccionadas para el anlisis.

Figura 1. Poblacin y muestra
Muestra representativa: Subconjunto de sujetos que pertenecen a una
poblacin determinada. Debera tener las mismas caractersticas generales que
la poblacin. En caso contrario, tenemos una muestra sesgada. (M. J. Navas,
2001, p. 19). Ir al referente. Los dos principios que determinan la
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

12


representatividad de una muestra son, la forma de seleccin, que debe ser
aleatoria y el otro corresponde al tamao de la muestra.

Parmetros: Segn Moore, D. (2000) es un nmero que describe alguna
caracterstica de la poblacin. En la prctica estadstica el valor del parmetro no
es conocido ya que en muchos casos no podemos examinar toda la poblacin.
Pudiendo ser por ejemplo el porcentaje de personas con VIH en Colombia, aqu
el parmetro es la Proporcin de personas en la poblacin (Colombia) que
tienen dicho virus.
Es conveniente el uso de un smbolo general para designar el parmetro de
inters, entonces ste ser: u

Entre los parmetros ms importantes tenemos:

N = Tamao total de la poblacin
= Promedio Poblacional

= Varianza Poblacional
= Desviacin estndar Poblacional
t = Total Poblacional
=Proporcin poblacional

Estadstico: Es un nmero que se puede calcular a partir de los datos de la
muestra. Moore, D. (pg. 270). Entonces un estadstico mide caractersticas,
pero en una parte de la poblacin, es decir, en una muestra; por ejemplo el
porcentaje de personas en Bogot con VIH; aqu se evidencia que la muestra es
la capital en donde se est analizando una caracterstica, lo que permite sacar
conclusiones de todo el pas, por lo cual se dice que la inferencia suministra
conclusiones de la poblacin sirvindose de los resultados encontrados en las
muestras.

El objetivo fundamental del muestreo es Estimar los parmetros de la
poblacin a partir de algunos elementos cuyas mediciones son los Estadsticos
Los estadsticos ms utilizados por su importancia son:

n =Tamao de la muestra

=Promedio de muestra
S
2
=Varianza Muestra
S =Desviacin estndar Muestra
=Total Estimado
p =Proporcin Muestra

Cuando los dos nuevos trminos de arriba son usados, por ejemplo, el proceso
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

13


de estimacin en inferencia estadstica puede ser descrito como el proceso de
estimar un parmetro a partir del estadstico correspondiente, tal como usar una
media muestra (un estadstico) para estimar la media de la poblacin (un
parmetro).

Error de muestreo (error muestral): En estadstica se sabe que existen
diferencias entre lo que se obtuvo en el estudio y lo que se esperaba. En el
proceso de estimacin es poco probable que la media Muestra sea idntica a la
media poblacional, igual para la varianza y la desviacin estndar. El error de
muestreo es la diferencia entre el estadstico y el parmetro, es decir diferencia
entre lo encontrado en la muestra con lo esperado en la poblacin.

|

| u es el Parmetro y


es el estadstico.

Recuerde que | | es el smbolo de valor absoluto

A medida que el tamao de la muestra aumenta el error de muestreo disminuye,
es decir, son inversamente proporcionales.

Error tolerable: Se considera el error tolerable al error mximo que se
est dispuesto a aceptar y an considerar que el muestreo ha alcanzado
su objetivo. En todo estudio estadstico siempre se considera un error tolerable,
partiendo del principio que a menor error tolerable, mayor ser el tamao de
la muestra. Si u es el parmetro y

es

el estadstico, el error tolerable est


determinado por B, donde:
|

|

Error estndar: La desviacin estndar de una distribucin, en el
muestreo de un estadstico, es frecuentemente llamada el error estndar del
estadstico. Por ejemplo, la desviacin estndar de las Medias de todas las
muestras posibles del mismo tamao, extradas de una poblacin, es llamada el
error estndar de la media. De la misma manera, la desviacin estndar de las
proporciones de todas las muestras posibles del mismo tamao, extradas de una
poblacin, es llamada el error estndar de la proporcin. La diferencia entre los
trminos desviacin estndar y error de estndar es que la primera se refiere
a los valores originales, mientras que la segunda est relacionada con valores
calculados.




UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

14


1.2. Razones para seleccionar una muestra

Entre los motivos que inducen a tomar una muestra aleatoria estn:

Naturaleza Destructiva: Existen casos donde se requiere destruir los
elementos de la muestra para medir la caracterstica, como es el caso de
medir la resistencia de un material, el vaco de un producto enlatado, otros. No
es lgico pensar en destruir todos los elementos de la poblacin, de all que se
tome una muestra.

Imposibilidad Fsica de Medir Todos los Elementos de la Poblacin:
Se sabe que existen poblaciones muy grandes, consideradas infinitas y es
casi imposible conocer todos los elementos de la misma.

Costos: Estudiar todos los elementos de la poblacin es muy costoso, tanto en
tiempo como en dinero, por lo que es ms rentable hacer un estudio Muestra.

Confiabilidad del Estudio Muestra: Esta demostrado con soporte matemtico
que una muestra representativa arroja resultados que permiten inferir sobre la
poblacin con una confiabilidad muy alta.

Unidad de observacin: Son los elementos que se miden; es decir, sobre los
que se toman los datos de las variables a medir. En el caso de los hogares, la
unidad de observacin sern las personas y en el caso de las llantas del
automvil, cada una sern las unidades de observacin.

Marco de muestreo: Se considera el referente para identificar las unidades de
observacin, ste NO incluye todos los elementos de la poblacin. Ejemplos de
marcos de muestreo tenemos el directorio telefnico de una ciudad, como
potenciales votantes, el registro de ventas de los ltimos 5 aos en
una compaa comercializadora y muchos otros.


1.3. Etapas en la Seleccin de La Muestra
En todo estudio de muestreo se debe definir las etapas que permiten su
desarrollo.

a) Definicin de objeto de Estudio: Comprende la identificacin del problema y
el establecimiento de las metas que busca el estudio.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

15


b) Marco de Muestreo: Establecimiento de una metodologa para identificar los
elementos que estarn en el muestreo, sus caractersticas y el modelo que
los identifica.

c) Identificacin de Variables: Es pertinente identificar las variables de
estudio, para as definir la forma de medicin que se hara.

d) Tamao de la Muestra: Por medio del modelo de muestreo pertinente
seleccionar la muestra representativa, sobre la que se realizarn las
mediciones.

e) Unidad de Muestreo: Se debe extraer las unidades de muestreo segn el
modelo definido que determinan las n unidades maestrales de la poblacin N.

f) Trabajo de Campo: Son todas las acciones necesarias para obtener la
informacin, definiendo los costos, desplazamientos, herramientas fsica y
logsticas para su realizacin.

g) Anlisis de Informacin: La informacin obtenida, requiere de un proceso
estadstico, el cual puede ser descriptivo o inferencia, para el curso que
nos ocupa se deben hacer los dos.

h) Resultados: Con el proceso desarrollado sobre los datos obtenidos, se
procede a la emisin de los resultados y la confrontacin con las metas
propuestas para verificar el grado de eficiencia del trabajo realizado. Es
pertinente saber presentar los resultados, ya que un buen trabajo que no se
presente de la mejor manera, quedara oscuro en su informacin.

Leccin No 2: Tipos de muestreo y seleccin de muestra

Tipos de Muestreo

Con los conceptos previos que se han analizado, ahora corresponde
estudiar las clases de muestreo. Los dos grandes grupos estn enmarcados en
las siguientes clases:

- Muestreo probabilstico
- Muestreo No probabilstico


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

16


2.1. Muestreo No Probabilstico

Son aquellos muestreos donde los elementos de la muestra se toman al azar,
siendo imposible determinar el grado de representatividad de la muestra. Para
el caso de una poblacin homognea, la representatividad de tal muestra puede
considerarse satisfactoria.

Por otra parte, en problemas comerciales diarios y en la toma de decisiones
que a falta de tiempo no permiten disecar mtodos de muestreo probabilstico
hay que recurrir a este tipo de muestreo, donde el investigador conoce la
poblacin.

Dentro del muestreo no probabilstico se conoce varios
tipos:
- Muestreo por conveniencia.
- Muestreo por juicio
- Muestreo Causa / Efecto
- Muestreo por Cuotas
- Muestreo de Poblaciones Mviles

2.1.1. Muestreo por conveniencia
La muestra se determina por conveniencia, incorporando elementos en la muestral
sin probabilidades especificadas o conocida de seleccin. Por ejemplo un
profesor que se encuentra investigando una causa universitaria, puede usar
alumnos voluntarios para formar la muestra, tan solo porque dispone fcilmente
de ellos y participan como elementos a un costo pequeo o nulo. Tiene la
ventaja de ser de fcil seleccin y recoleccin de sus datos. Tiene la
desventaja de no poderse evaluar en su bondad de la muestra en
funcin de la representatividad de la poblacin, motivo por el cual se hace
imposible inferir a cerca de la poblacin correspondiente.

2.1.2. Muestreo por juicio
En este mtodo la persona por experiencia y capacidad selecciona a los
individuos u otros elementos de la poblacin, que supone son los ms
representativos de esa poblacin. Por ejemplo un reportero puede
muestrear uno o dos senadores, por considerar que ellos reflejan la opinin
general de todos.

2.1.3. Muestreo causa / efecto
Se realiza cuando no hay una poblacin definida y se requiere tomar
elementos para el estudio en cuestin, caso por el cual se toman los elementos
disponibles.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

17



2.1.4. Muestreo por cuotas

Cuando es necesario obtener una cantidad dada de elementos que constituyen
una muestra proporcional a la poblacin, se toman elementos hasta cubrir
dicha cuota. El caso de tomar una cantidad de carros en una esquina para
hacer un estudio sobre accidentalidad en dicho sitio.

2.1.5. Muestreo de poblaciones mviles

Mtodo propio de poblaciones mviles como en estudios de migracin
ocurridos en un sitio determinado. El caso tpico es con animales que migran,
donde se hace captura-marca- recaptura.

2.2. Muestreo Probabilstico

El muestreo aleatorio o muestreo probabilstico, es aquel en que cada uno de
los elementos de la poblacin objeto de estudio, tienen una probabilidad
matemtica conocida, y frecuentemente igual, para ser elegido en la muestra.

Muestra probabilstica
Una muestra se considera probabilstica si cumple con las siguientes
condiciones:

a) Se pueda definir un conjunto de muestras M
1
, M
2
, M
3
... Mi posibles
derivados del proceso de seleccin propuesta. As se puede i dentifi car
que unidades de muestreo pertenecen a la muestra M
1
, M
2
, M
3
... Mi

b) A cada muestra posible le debe corresponder una probabilidad de
seleccin conocida P(S).

c) El proceso de seleccin garantiza que todos los elementos de la poblacin
tienen una probabilidad P(y
i
)>0 de ser elegido en alguna muestra.

d) La seleccin es un proceso aleatorio que garantiza que cada
muestra S tenga una probabilidad P(S) de ser elegida. Muestreo aleatorio
simple
Dentro del muestreo probabilstico o aleatorio existen cuatro mtodos:
1. Muestreo aleatorio simple
2. Muestreo estratificado
3. Muestreo sistemtico
4. Muestreo por conglomerados
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

18



2.2.1. Muestreo Aleatorio Simple

El M A S es la forma m s sencilla de muestreo probabilstico y es la base de
tcnicas ms complejas. La muestra se puede tomar de una poblacin finita
o infinita, la cantidad de muestras posibles depende del tipo de diseo y la
forma de tomar las muestras. Este tipo de muestreo se utilize cuando se
considera que la poblacin es ms o menos homognea. Como ya sabemos el
muestreo puede ser con y sin reemplazamiento.

El marco de muestreo corresponde a la lista codificada de todas las observaciones
que hacen parte de la poblacin. La muestra se elige de tal manera que cada
observacin tiene la misma probabilidad de ser elegida, la eleccin de una
observacin NO tiene influencia sobre la eleccin de otra. Es de aclarar que en el
M.A.S la unidad de muestreo es igual a la unidad de observacin.

Este tipo de muestreo requiere la construccin de un marco de
muestreo, consistente en el listado completo de las unidades de la
poblacin.

Tcnicas para Seleccionar la Muestra

a) Tabla de nmeros aleatorios

(Ver tabla siguiente). Se enumeran las unidades que conforman la poblacin
objetivo de estudio, partiendo desde 01 hasta 99, desde 001 hasta 999, y as
sucesivamente, dependiendo del tamao poblacional. Luego se define el
tamao de la nuestra y como los elementos de la poblacin estn
listados y codificados, entonces se establece un punto de partida:
Columna x Fila y, se van leyendo ya sea horizontal o verticalmente los
nmeros de la tabla hasta completar el tamao de la muestra.

Ejemplo

Suponga que tenemos N=30 facturas de servicios pblicos (unidades en la
poblacin), saque una muestra aleatoria simple de tamao n=5.

Paso 1: Asigne etiquetas: D a cada unidad en la poblacin un nmero, etiqueta o
identificacin. Todas las etiquetas deben tener el mismo nmero de dgitos. Como
tenemos 30 unidades y el nmero 30 tiene dos dgitos, todas las unidades tienen
que tener dos dgitos.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

19


Tabla 1.
Facturas de servicios pblicos


Paso 2: Use la tabla: Empezando en un lugar escogido al azar lea grupos de
dgitos (dependiendo del nmero de dgitos en las etiquetas) de izquierda a
derecha, continuando con la lnea siguiente cuando se acabe la lnea que est
leyendo. Si el grupo de dgitos corresponde a una de las etiquetas, ese nmero
identifica a una de las unidades que ser seleccionada. Si el grupo de dgitos no
corresponde a una de las etiquetas o si ya fue seleccionado, se salta al grupo
siguiente.

Por ejemplo suponga que el lugar de partida escogido al azar fue la fila 05,
columna 1 (la columna 1 es la 12345) y la lectura sera vertical (aunque puede ser
horizontal):

Se toman dos digitos porque la muestra es 30 (que tiene dos digitos)
33850 Este nmero no se escoge porque est por encima de 30

97340
Este nmero no se escoge porque solo se escogen numerous entre
01 y 30. Se sigue buscando y se llega hasta un nmero menor o
igual a 30

Este nmero si se escoge porque es menor a 30.
14756

Se contina y si con la primera columna no se han encontrado los 5 nmeros para
la muestra se pasa a la siguiente.
Cabe notar que el nmero 23913 de la tabla se salta ya que se repite el 23 que se
encontr en 23236
La muestra est conformada por las observaciones que se ubican en la posicin:
14, 23, 09, 11 y 06


Recibo No. Valor $ Recibo No. Valor $ Recibo No. Valor $
01 $ 45.661 11 $ 37.798 21 $ 44.901
02 $ 43.629 12 $ 33.672 22 $ 40.155
03 $ 41.502 13 $ 39.607 23 $ 48.082
04 $ 45.069 14 $ 34.904 24 $ 32.825
05 $ 45.813 15 $ 36.701 25 $ 45.915
06 $ 49.687 16 $ 34.001 26 $ 30.382
07 $ 45.960 17 $ 36.302 27 $ 41.835
08 $ 35.001 18 $ 48.728 28 $ 47.227
09 $ 49.553 19 $ 48.706 29 $ 48.485
10 $ 46.976 20 $ 34.881 30 $ 45.159
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

20


Tabla 2.
Nmeros aleatorios

Columna


00000 00001 11111 11112 22222 22223 33333 33334
Rengln 12345 67890 12345 67890 12345 67890 12345 67890
01 49280 88924 35779 00283 81163 07275 89863 02348
02 61870 41657 07468 08612 98083 97349 20775 45091
03 43898 65923 25078 86129 78496 97653 91550 08078
04 62993 93912 30454 84598 56095 20664 12872 64647
05 33850 58555 51438 85507 71865 79488 76783 31708

06 97340 03364 88472 04334 63919 36394 11095 92470
07 70543 29776 10087 10072 55980 64688 68239 20461
08 89382 93809 00796 95945 34101 81277 66090 88872
09 37818 72142 67140 50785 22380 16703 53362 44940
10 60430 22834 14130 96593 23298 56203 92671 15925

11 82975 66158 84731 19436 55790 69229 28661 1367512
39087 71938 40355 54324 08401 26299 49420 59208
13 55700 24586 93247 32596 11865 63397 44251 43189
14 14756 23997 78643 75912 83832 32768 18928 57070
15 32166 53251 70654 92827 63491 04233 33825 69662

16 23236 73751 31888 81718 06546 83246 47651 04877
17 45794 26926 15130 82455 78305 55058 52551 47182

18 09893 20505 14225 68514 46427 56788 96297 78822
19 54382 74598 91499 14523 68479 27686 46162 83554
20 94750 89923 37089 20048 80336 94598 26940 36858
21 70297 34135 53140 33340 42050 82341 44104 82949
22 85157 47954 32979 26575 57600 40881 12250 73742

23 11100 02340 12860 74697 96644 89439 28707 25815
24 36871 50775 30592 57143 17381 68856 25853 35041
25 23913 48357 63308 16090 51690 54607 72407 55538

26 79348 36085 27973 65157 07456 22255 25626 57054
27 92074 54641 53673 54421 18130 60103 69593 49464
28 06873 21440 75593 41373 49502 17972 82578 16364
29 12478 37622 99659 31065 83613 69889 58869 29571

30 57175 55564 65411 42547 70457 03426 72937 83792

31 91616 11075 80103 07831 59309 13276 26710 73000
32 78025 73539 14621 39044 47450 03197 12787 47709
33 27587 67228 80145 10175 12822 86687 65530 49325

34 16690 20427 04251 64477 73709 73945 92396 68263
35 70183 58065 65489 31833 82093 16747 10386 59293

36 90730 35385 15679 99742 50866 78028 75573 67257
37 10934 93242 13431 24590 02770 48582 00906 58595
38 82462 30166 79613 47416 13389 80268 05085 96666
39 27463 10433 07606 16285 93699 60912 94532 95632

40 02979 52997 09079 92709 90110 47506 53693 49892

41 46888 69929 75233 52507 32097 37594 10067 67327
42 53638 83161 08289 12639 08141 12640 28437 09268
43 82433 61427 17239 89160 19666 08814 37841 12847
44 35766 31672 50082 22795 66948 65581 84393 15890
45 10853 42581 08792 13257 61973 24450 52351 16602

46 20341 27398 72906 63955 17276 10646 74692 48438
47 54458 90542 77563 51839 52901 53355 83281 19177
48 26337 66530 16687 35179 46560 00123 44546 79896
49 34314 23729 85264 05575 96855 23820 11091 79821
50 28603 10708 68933 34189 92166 15181 66628 58599

Fuente:Web
Paso 3: Indicar segn las posiciones que arroja la tabla de nmeros aleatorios
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

21



cuales elementos se escogern para la muestra

Tabla 3:
Seleccin muestra de 5 recibos ejemplo 1











Este mtodo de seleccin permite que todos los elementos que constituyen la
poblacin tengan la misma posibilidad de ser incluidos en la muestra. Los
elementos se escogen en forma individual y aleatoriamente de la totalidad de
la poblacin. Esta seleccin puede ser sin reemplazamiento, similar a la que
se realiza en la extraccin aleatoria de nmeros en el juego denominado baloto.
Cada elemento que constituye la muestra se selecciona una sola vez,
denominndose extracciones sin reposicin.

En otras ocasiones, cada elemento puede ser elegido ms s de una vez en
la misma muestra, como por ejemplo, cuando se selecciona aleatoriamente el
nmero ganador de una lotera, que puede ocurrir ser el mismo nmero; en
estos casos se dice que las extracciones son realizadas con reposicin.

b) Programa de Computador: Utilizando el programa Excel que es el ms
comn se puede desarrollar nmeros aleatorios de la siguiente manera:

Si la poblacin es de N = 1.000 observaciones y se desea una muestra de 20,
entonces: Sobre una celda se escribe =ALEATORIO ()*N y se da clic, el
sistema genera el primer nmero aleatorio, se despliega en la parte inferior
derecha de la celda del nmero hasta el tamao de la muestra definida.

Sintaxis para obtener nmeros aleatorios de una poblacin de 1000
observaciones




Figura 2. Sintaxis nmero aleatorio en Excel
No. Recibo Valor $ No. Recibo Valor $ No. Recibo Valor $
01 $ 45.661 11 $ 37.798 21 $ 44.901
02 $ 43.629 12 $ 33.672 22 $ 40.155
03 $ 41.502 13 $ 39.607 23 $ 48.082
04 $ 45.069 14 $ 34.904 24 $ 32.825
05 $ 45.813 15 $ 36.701 25 $ 45.915
06 $ 49.687 16 $ 34.001 26 $ 30.382
07 $ 45.960 17 $ 36.302 27 $ 41.835
08 $ 35.001 18 $ 48.728 28 $ 47.227
09 $ 49.553 19 $ 48.706 29 $ 48.485
10 $ 46.976 20 $ 34.881 30 $ 45.159
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

22



Al dar clic se genera el primer nmero aleatorio y desplegando se obtiene los
que se desea.
De esta manera se obtiene los nmeros aleatorios que se requieren
para tomar la muestra aleatoria de la poblacin objeto de estudio. Si se
vuelve a hacer el proceso, se obtendrn nuevos nmeros y cada que se realice
un nuevo proceso, se generarn diferentes nmeros; esto por lo de Aleatorio.


VIDEOS



c) Mtodo de Fan Muller:

Para seleccionar una muestra aleatoria simple mediante este mtodo hay que
seguir los siguientes pasos:

1. Para cada elemento de la poblacin se genera un nmero aleatorio entre 0
y 1. Ese nmero aleatorio se llamar r.

2. Se hace un recorrido secuencial de la poblacin y se incluye a la muestra
el nmero aleatorio r si cumple:


Comprobando que no estuviera anteriormente introducida, en el caso de
que est repetida se pasa a la siguiente unidad. Si se introduce la unidad
se vuelve a empezar en el paso 1.
3. El algoritmo termina cuando




d) Coordinado Negativo: El proceso general es de la siguiente manera:

1. Se adiciona una variable aleatoria U con distribucin uniforme U (0, 1)
2. Se ordena el marco muestral segn la distribucin U.
3. La muestra se forma de los n primeros elementos del marco ordenado



Seleccin de
muestras a travs
de M.A.S
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

23



2.2.2. Muestreo Aleatorio Estratificado

En el diseo de muestreo probabilstico, es pertinente identificar la poblacin
objeto de estudio, ya que no siempre la variable de anlisis es ms o menos
homognea. Si se desea analizar la variable peso; por lo general los hombres
pesan ms s que las mujeres, en estratos altos se paga ms arriendo que
en estratos bajos. En estos y otros muchos casos el M. A. S. no es adecuado.
En casos donde la poblacin es muy heterognea respecto a la variable
de estudio el muestreo estratificado es mejor que el muestreo aleatorio simple.
La palabra estratificar hace referencia a formar Capias.

DEFINICIN: Una muestra aleatoria estratificada se obtiene mediante la
separacin de los elementos de la poblacin en subgrupos llamados ESTRATOS,
los cuales son disyuntos.

Obtenidos los estratos, en cada uno se obtiene la muestra por M.A.S para el
estudio de la variable de inters.

Como los elementos de los estratos son disyuntos, entonces cada
unidad de muestreo pertenece solo a un estrato. Las muestras
seleccionadas en los estratos deben ser independientes; es decir, la elegida
en un estrato no debe afectar la eleccin de otra muestra en otro estrato.

La esencia de la estratificacin es que sta saca provecho de la
homogeneidad conocida de las sus poblaciones, de tal forma slo se requieran
muestras relativamente pequeas para estimar las caractersticas de cada
sub-poblacin, estas estimaciones individuales pueden entonces ser
fcilmente combinadas para producir una estimacin de toda la
poblacin; adems, la economa en el tamao de la muestra, un
valioso sub-producto del esquema del muestreo estratificado es que las
estimaciones obtenidas para diferentes partes de la poblacin se
pueden usar posteriormente para hacer comparaciones.

Para una descripcin general del muestreo aleatorio estratificado y los
mtodos de inferencia asociados con este procedimiento, suponemos
que la poblacin est dividida en h subpoblaciones o estratos de tamaos
conocidos N
1
, N
2
,..N
h
tal que las unidades en cada estrato sean
homogneas respecto a la caracterstica en cuestin.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

24





Figura 3. Poblacin divida en estratos

Ejemplo

Poblacin de tutores del CEAD Ibagu - UNAD (ver figura 3). El tamao de la
poblacin 18 tutores (N= 18), la cual est dividida en 3 escuelas o subgrupos
(H=3). Cada escuela es un estrato, y se tiene que son diferentes los perfiles de los
tutores de una escuela a otra pero al interior de cada una son similares sus
profesiones, esto significa que los subgrupos son heterogneos entre s, pero
homogneos dentro de cada uno.


VENTAJAS DEL MUESTREO ESTRATIFICADO

1. Evitar la obtencin de muestras errneas, tal es el caso de
escoger elementos que podran sesgar el muestreo, por consiguiente
se puede perder representatividad de la poblacin.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

25


2. Obtener informacin precisa de ciertos subgrupos para hacer
comparaciones

3. Producir un lmite de error de estimacin (B) ms pequeo, comparado con
el obtenido en el M.A.S. para un mismo tamao de muestra.

4. Los costos por observacin en las encuestas son ms reducidos ya
que se evitan desplazamientos extremos.

5. Las estimaciones se obtienen por subgrupos as los estratos se hacen
identificables.


Notacin: Partiendo de la poblacin o universo U cuyo tamao es N,
sta se divide en N
L
estratos.


Figura 4. Tamao de estratos

N = N
1
+ N
2
++N
L (Tamao poblacional)

= Tamao del estrato i.

= Valor de la observacin j en el Estrato i.


= Media poblacional en el estrato i.

= Varianza poblacional en el estrato i.

= Total poblacional en el estrato i.

Proporcion poblacional en el estrato i


La media poblacional del estrato, la varianza poblacional del estrato, el
total poblacional del estrato y el total poblacional, se obtiene de la siguiente
manera:

En cada estrato se obtiene una muestra aleatoria por M.A.S. Si tenemos el
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

26


estrato l, se puede hacer el siguiente anlisis.

Tamao de la muestra en el estrato i

Promedio de la muestra del estrato i

Varianza muestral del estrato i


Proporcin estimada del estrato i

Donde

son los elementos j del estrato i



Tamao de la submuestras en los estratos

) Ecuacin No.1
Dnde:
N = Tamao de la poblacin
N = Tamao de la muestra
Ni= Tamao del estrato i
ni= Tamao de muestra en el estrato i
N= N1+N2+N3+..+Nh
n = n1 + n2++ ni
Ejemplo

La seccin operativa de una empresa de confecciones cuenta con 100
empleados, la cual est dividida en operarios de maquina plana, dibujantes y
cortadores, de los que hay 40, 35 y 25 operarios respectivamente; se quiere hacer
un estudio estadstico y se toma una muestra de 20 empleados. Cuntos
operarios de cada lnea deben escogerse si la seleccin se hace a travs de un
muestreo estratificado?

N= 100
n = 20

N1= 40
N2= 35
N3= 25
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

27

)
La muestra de 20 empleados debe estar compuesta por 8 de mquina plana,
7 dibujantes y 5 cortadores.

2.2.3. Muestreo Sistemtico

Es utilizado por algunos contadores para revisar sumas, cuentas, inventarios,
etc., por ser un mtodo directo y econmico. Consiste en seleccionar uno a
uno, los elementos de la muestra en un orden determinado, dando un inicio
aleatorio. Es decir, la muestra queda ordenada.
La fraccin de muestreo se establece por medio de la siguiente relacin:


Dnde:
f = Fraccin de muestreo
N= Poblacin
n = Tamao de la muestra
Ejemplo

De una poblacin de 1.000 observaciones, se desea tomar una muestra de 10,
cules seran las observaciones que haran parte de la muestra sistemtica.

La fraccin de muestreo es:


f = Fraccin de muestreo
N= Poblacin
n = Tamao de la muestra

El primer elemento se selecciona aleatoriamente en el intervalo cero a cien,
por ejemplo seleccionando el nmero 25, el segundo elemento que se
selecciona es 125 (25+100), luego el 225 (125+100) y as sucesivamente, hasta
completar la muestra de diez.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

28



Puede ver un ejemplo de muestreo sistemtico en:
https://sites.google.com/site/unadjeammysh/recursos-de-apoyo

Figura 5. Recursos de apoyo

Un problema especfico del muestreo sistemtico es la existencia de cualquier
factor peridico o cclico en la lista de la poblacin que pudiera conducir a
un error sistemtico en los resultados muestrales.

Ejemplo

Si en un hospital hay un universo de quince mil cien historias clnicas
que estn numeradas interrumpidamente y se desea tener una muestra
equivalente al 10%, o sea, mil quinientas diez historias, ello significa que ha
de tomarse una de cada 10, ya que (15100 /1510 = 10). La primera historia
puede seleccionarse del primer grupo de 10. Si la primera historia
seleccionada es la nmero 8 en la poblacin, teniendo en cuenta que el
ocho es un nmero cualquiera tomado aleatoriamente; la segunda ser la 18=
(8+10) la tercera ser la 28 = (18 + 10), la cuarta ser la 38 = (28 + 10), y as
sucesivamente.

La estimacin y tamao de muestra tiene un anlisis similar al muestreo
aleatorio simple M.A.S.


2.2.4. Muestreo Conglomerados

Este es un mtodo de muestreo aleatorio en el que los elementos de la
poblacin se dividen en forma natural en subgrupos, de tal forma que dentro de
ellos sean lo ms heterogneo posible y entre ellos sean homogneos, caso
contrario al muestreo estratificado.

Este tipo de muestreo se usa en particular cuando no se dispone de una
Clic all para descargar archivo
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

29


lista detallada y enumerada de cada una de las unidades que conforman el
universo y resulta muy complejo elaborarla. Se le denomina as debido a
que en la seleccin de la muestra en lugar de escogerse cada unidad se
procede a tomar los subgrupos o conjuntos de unidades, a los que se llama
"conglomerados". Aunque quiz por ello se tienda a creer que es lo
mismo que el estratificado, ambos se diferencian en que en los
conglomerados los subconjuntos se dan en la vida real o ya estn
agrupados de esa manera; por ejemplo: Escuelas, tipos de Industrias,
bloques de casas y otros. En el estratificado el investigador decide las
agrupaciones que utilizar segn la posible variabilidad de los fenmenos a
estudiar; otra diferencia es que en este el investigador conoce la distribucin
de la variable, todo lo contrario que en el muestreo por conglomerado.

El proceso se indica definiendo los conglomerados, despus se seleccionan los
subconjuntos a estudiar (o sea, que se realiza un muestreo de
conglomerados); de estos seleccionados se procede a hacer el listado de las
unidades que componen cada conglomerado, continuando posteriormente con la
seleccin de las unidades que integrarn la muestra, siguiendo algunos de los
mtodos aleatorios indicados.

Si se desea hacer un estudio en las escuelas de educacin primaria sobre un
determinado fenmeno, inicialmente se seleccionan las escuelas que se
estudiarn, de esas escuelas seleccionadas se determinan los grados o clases
que deben incluir y posteriormente se escogen los alumnos, que sern las
unidades de observacin, utilizando uno de los mtodos aleatorios. Se estima
que las inferencias que se hacen en una muestra conglomerada no son tan
confiables como las que se obtienen de un estudio hecho por muestreo aleatorio.

Ejemplo

Si un analista de la Secretara de Salud necesita hacer un estudio de los
servicios mdico-asistenciales que reciben los trabajadores del rea
metropolitana, sera difcil obtener una lista de todos los trabajadores de la
poblacin objetivo. Sin embargo podra obtenerse una lista de las empresas y
fbricas del rea. Con esta lista, el analista puede tomar una muestra aleatoria
de las empresas o fbricas, que representan conglomerados de
trabajadores, y obtener la informacin de los servicios mdicos que se les
estn prestando.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

30


Leccin No 3: Tipos de Seleccin de Muestras

En el diseo Muestra hacemos referencia a la probabilidad de seleccin, la
cual consiste en definir el valor de probabilidad de que una muestra dada
sea seleccionada. En teora de probabilidad existen dos tipos de seleccin:

3.1. Seleccin con Reemplazamiento:

Consiste en que los elementos seleccionados una vez medidos vuelven a la
muestra, lo que hace que el espacio Muestra permanezca constante. Por lo
anterior la ocurrencia de un evento no afecta la ocurrencia de otro, por lo que
los eventos se consideran independientes.

Ejemplo

Si en una bolsa se tiene 4 bolas blancas y 5 bolas negras. Cul ser
la probabilidad que al seleccionar dos bolas, estas sean blancas?

La probabilidad de que la primera sea negra es: (


La probabilidad de que la segunda sea negra es: (





3.2. Seleccin sin Reemplazamiento:

Los elementos elegidos una vez la medicin, estos NO vuelven a la
muestra, lo que hace que el espacio muestral cambie a medida que se van
tomado elementos de la muestra.

Ejemplo

Si en una bolsa se tiene 4 bolas blancas y 5 bolas negras. Cul ser la
probabilidad que al seleccionar dos bolas estas sean blancas, la seleccin es
sin reemplazamiento?

La probabilidad de que la primera sea negra es: 4/9
La probabilidad de que la segunda sea negra es: 3/8
Recordemos que una vez elegida la primera, sta no vuelve a la muestra.



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

31


Ejemplo

Suponga que tenemos N = 4 unidades 1, 2, 3 y 5 en una poblacin
hipottica y desea seleccionar muestras con reemplazamiento y sin
reemplazamiento de tamao n=2

Para los propsitos de esta seleccin, los valores podran ser el nmero de
las personas que viven en cada una de cuatro unidades habitacionales que
constituyen una poblacin. Se realizar una comparacin entre el muestreo
aleatorio con y sin reemplazamiento para una muestra de tamao n=2.
Primero se listan todas las posibles muestras no ordenadas de tamao n= 2.


Para recordar:


Tabla 4:
Tcnicas de conteo
Muestreo Con Orden Sin Orden
Con Repeticin - Regla del exponente (o permutaciones
con repeticin)
N
n

- Multiplicacin de opciones:
n
1
x n
2
x n
3.

Combinaciones
()
( )
( )


Sin Repeticin

Permutaciones (de n elementos tomados
todos a la vez)
N! =
N
P
n



Permutaciones (de N elementos tomados
de r en r. con )

( )


Combinaciones (de N
elementos tomados de r en r.
con )

( )


Leccin No 4: Mtodos de Inferencias, Paramtrico y No
Paramtrico

4. Mtodos De Inferencia
Los procedimientos de inferencia permiten establecer conclusiones acerca de
una poblacin, a partir de las propiedades estudiadas en una muestra de ella.
Adems, como dichas conclusiones dependen de sucesos aleatorios, se les
asociar un nivel de confianza o de verosimilitud.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

32




Grfico No.1 Mtodos de inferencia

4.1. Mtodos Paramtricos
Resuelve objetivos relacionados con parmetros de una poblacin, tales como
media, varianza, proporcin etc. Estos modelos se apoyan en el conocimiento
de la distribucin de probabilidad asociada a dicha poblacin aunque se
desconozca algn parmetro de dicho modelo. Por ejemplo podemos suponer
que el nmero de clientes atendidos por hora en una entidad bancaria sigue un
modelo de Poisson pero de parmetro desconocido.

Para resolver un problema de inferencia paramtrico se utilizan dos tipos de
procedimientos:

4.1.1. Estimacin: Puntual cuando obtenemos valores aproximados del
parmetro desconocido y una medida de error asociado; por Intervalos
cuando obtenemos un rango de valores, que contiene el verdadero valor
del parmetro con una probabilidad o confiabilidad prefijada.

4.1.2. Test de Hiptesis: Cuando aceptamos o rechazamos una hiptesis
relacionada con uno o varios parmetros de una poblacin desconocidos,
con un cierto nivel de error prefijado.

4.2. Mtodos no paramtrico
Los mtodos no paramtricos se refieren a menudo como distribucin
libremente mtodos pues no confan encendido asunciones que los datos estn
dibujados del dado distribucin de la probabilidad. Resuelven situaciones
relacionadas con el tipo de distribucin de probabilidad asociada a la poblacin
de estudio u otros objetivos no relacionados directamente con parmetros.

Lo deseable en estos casos ser buscar la inferencia en contrastes que sean
vlidos bajo un amplio rango de distribuciones de la poblacin. Tales contrastes
se denominan no paramtricos.
Mtodos de
Inferencia
Parmetrico
Estimacin
Pruebas de
Hiptesis
No
Parmetrico
Pruebas No
Parmetricas
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

33



El trmino no paramtrico no se significa implicar que tales modelos carecen
totalmente parmetros, sino que el nmero y la naturaleza de los parmetros son
flexibles y no fijados por adelantado.

Ventajas y Desventajas

Las pruebas no paramtricas no necesitan suposiciones respecto a la
composicin de los datos poblacionales. Las pruebas no paramtricas son de
uso comn:

1. Cuando no se cumplen las suposiciones requeridas por otras
tcnicas usadas, por lo general llamadas pruebas paramtricas.
2. Cuando es necesario usar un tamao de muestra pequeo y no es
posible verificar que se cumplan ciertas suposiciones clave.
3. Cuando se necesita convertir datos cualitativos a informacin til para
la toma de decisiones.
Existen muchos casos en los que se recogen datos medidos en una escala
nominal u ordinal. Muchas aplicaciones de negocios involucran opiniones o
sentimientos y esos datos se usan de manera cualitativa.

Ventajas

Las pruebas no paramtricas tienen varias ventajas sobre las pruebas
paramtricas:

1. Por lo general, son fciles de usar y entender.
2. Eliminan la necesidad de suposiciones restrictivas de las pruebas
paramtricas.
3. Se pueden usar con muestras pequeas.
4. Se pueden usar con datos cualitativos.

Desventajas

Tambin las pruebas no paramtricas tienen desventajas:

1. A veces, ignoran, desperdician o pierden informacin.
2. No son tan eficientes como las paramtricas.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

34



Leccin No 5: Estimadores y propiedades de los estimadores

5. Estimador
En estadstica, un estimador es un estadstico (esto es, una funcin de la
muestra) usado para estimar un parmetro desconocido de la poblacin. Por
ejemplo, si se desea conocer el precio medio de un artculo (el parmetro
desconocido) se recogern observaciones del precio de dicho artculo en
diversos establecimientos (la muestra) y la media aritmtica de las
observaciones puede utilizarse como estimador del precio medio.
Para cada parmetro pueden existir varios estimadores diferentes. En general,
escogeremos el estimador que posea mejores propiedades que los restantes,
como insesgadez, eficiencia, convergencia y robustez (consistencia).

5.1. Propiedades de un estimador
El concepto de estimacin de parmetros mediante la especificacin de las
propiedades que deben cumplir los estimadores y el desarrollo de tcnicas
apropiadas para implementar el proceso de estimacin. Se utilizar el punto
de vista prctico de la teora del muestreo, que considera un parmetro como
una cantidad fija pero desconocida.

Para evaluar la calidad de un estadgrafo como un estimador este debe
cumplir las siguientes propiedades:

5.1.1. Insesgado

Un estimador insesgado es aquel cuya media o valor esperado de la distribucin
de las de las estimaciones es igual al parmetro estimado. En otras palabras,
cuando el promedio de un estimador muestral es igual al parmetro poblacional
que se desea estimar.

5.1.2. Eficiencia:

La eficiencia se refiere al tamao del error estndar del estadgrafo de la
muestra. Si se comparan dos estadgrafos de una muestra del mismo tamao y
se desea decidir cul de los dos es el estimador ms eficiente, se escoger
el estadgrafo que tenga el menor error estndar o desviacin de la
distribucin muestra. Supngase que se escoge una muestra de un tamao
dado y se decide cuando usar la media muestra o la mediana muestra para
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

35


estimar la media de la poblacin. Si se calcula el error estndar de la media
muestra y se encuentra que es igual a 2.15 y luego se calcula el error
estndar de la mediana muestra y se encuentra que es de 2.6, se podr
decir que la media muestra es un estimador ms eficiente de la media de la
poblacin porque su error estndar es menor o con menos variacin, tendr
una mayor oportunidad de producir un estimador ms cercano al parmetro de
la poblacin bajo estudio.

5.1.3. Consistencia:

Un estadgrafo es un estimador consistente de un parmetro de la poblacin
si en la medida en que el tamao de la muestra aumenta se est seguro de
que el valor del estadgrafo se acerca al valor del parmetro de la poblacin.

Cuando un estimador es consistente, se vuelve ms confiable tomando
muestras grandes. De esta manera, cuando usted se preocupa por
aumentar el tamao de la muestra para obtener ms informacin acerca de
un parmetro de la poblacin, debe primero encontrar si su estadgrafo es
un estimador consistente, si no es as, usted desperdiciar dinero y tiempo
al tomar muestras grandes.

5.1.4. Suficiencia:

Estadsticos que, de alguna manera, resumen toda la informacin de una muestra
relacionada con un parmetro objetivo, se dice que tienen la propiedad de
suficiencia, es decir, utilizan toda la informacin relevante contenida en una
muestra.














UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

36



Ejercicios propuestos

- En cierta cadena de centros comerciales trabajan 150 personas en el
departamento de personal, 450 en el departamento de ventas, 200 en el de
contabilidad y 100 en el de servicios al cliente. Con el objeto de realizar una
encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. Qu
nmero de trabajadores tendramos que seleccionar en cada departamento
atendiendo a un criterio de proporcionalidad
R/ta: 30, 90, 40, 20

- Suponga que se quiere estimar el nmero de das-hombre perdidos debido
a accidentes de trabajo en un mes particular. Adems se sabe que la mayor
parte de dichos accidentes se presentan en los niveles operativo, tcnico y
administrativo. Cul de los siguientes diseos de muestreo es el ms
aconsejable?:

R/ta: Estratificado, identificando como estrato los niveles de trabajo

- Supongamos que en la ciudad T hay 200 barrios. Si elegimos al azar dos
de estos barrios, de manera que la muestra est compuesta por todos
los individuos de esos dos barrios. Se trata de de:

R/ta: Por conglomerados

- Se ha proyectado realizar una encuesta sobre el consumo de leche en
las familias. El nmero de familias de la poblacin es 6000 y el tamao de
la muestra 840, con la siguiente clasificacin de profesin u oficio:

Profesionales: 100 Comerciantes: 200
Operarios: 2000 Agricultores: 600
Servicios
Generales:
1900 Empleados: 1200

Cuntas familias de agricultores deben estar representadas en la muestra.
R/ta: 84





UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

37



CAPITULO DOS: DISTRIBUCIONES MUESTRALES

Introduccin
Como se ha sealado anteriormente, el propsito del muestreo es averiguar las
caractersticas de la poblacin en estudio. Se recuerda de nuevo que para
poder dar conclusiones de los parmetros se usan los estadsticos que son
mediciones obtenidas en la muestra, mientras que los parmetros son
caractersticas medibles propias de la poblacin.

El escoger una muestra, es un proceso que inevitablemente puede arrojar
diferentes subconjuntos de la poblacin, por ejemplo de la poblacin de tutores,
se puede escoger como muestra los tutores de la ECBTI o escoger los de
ECEDU. El valor del estadstico es aleatorio porque depende de los elementos
elegidos en la muestra seleccionada- tambin aleatoria- de tamao n y, por lo
tanto, el estadstico tiene una distribucin de probabilidad la cual es llamada la
Distribucin Muestral del estadstico.

Objetivo general

Que los estudiantes lleguen a formar, no slo, una muestra si no un conjunto de
posibles muestras de una poblacin, con las unidades de observacin y sean
capaces de reconocer la distribucin de ese conjunto de muestras.


Objetivos especficos

- Comprender la importancia del teorema del lmite central.
- Establecer las diferencias entre un parmetro y un estadstico











UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

38



Leccin No 6: Distribuciones Muestrales

En estadstica, la distribucin muestral es lo que resulta de considerar todas las
muestras posibles que pueden ser tomadas de una poblacin. Su estudio permite
calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al
parmetro de la poblacin. Mediante la distribucin muestral se puede estimar el
error para un tamao de muestra dado.
Como bien lo afirma Ximenez, C. (S, F.) La estadstica inferencial trata sobre las
inferencias con respecto a las poblaciones (sus parmetros y
2
) a partir de la
informacin contenida en las muestras (los estadsticos y S
2
).
Para poder llevar a cabo esas inferencias es necesario conocer la relacin que se
establece entre estadsticos y parmetros. El concepto que permite poner en
relacin ambas cosas es la distribucin muestral de un estadstico.


Figura 6. Distribucin de un estadstico


Algunos estadsticos pueden ser: La media, la proporcin y la desviacin.
Recuerde que todos son clculos en las muestras.
A cada una de las muestras se les calcula el respectivo estadstico, es decir, se
tendr tantos estadsticos como muestras se haya obtenido. Por ejemplo, si el
estadstico que se est estimando es la media, y si se obtuvo 8 muestras,
entonces, sern 8 medias muestrales las que tendr.
Con todos los resultados del estadstico en todas las muestras, se forma la
distribucin muestral del estadstico.


Distribucin Muestral: Es la distribucin de Probabilidad de un estadstico
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

39


6. Diferentes distribuciones muestrales
Ya que a nivel muestral se pueden calcular diferentes estadsticos, como la
media, desviacin y la proporcin entre otros, se pueden encontrar sus
respectivas distribuciones muestrales, entre estas:

- Distribucin muestral de la medias
- Distribucin muestral de las proporciones
- Distribucin muestral de la diferencias de medias
- Distribucin muestral de la diferencias de proporciones

Nota: El muestreo se puede hacer sin o con reemplazamiento.

Ejemplo

En la figura a continuacin se tiene que la variable X, es el nmero de prrafos
digitado por minuto, X: 1, 2, 3, 4.


Figura 7. Distribucin de la poblacin

Poblacionalmente se tiene:
Parmetros
E(X)= 2.5
Var (X)= 1.1180

E(x) es el valor esperado de la variable o promedio, y V(x) es la varianza.
()


()
( )

( )

( )

( )

( )

()

()

()

()


Se sugiere al lector comprobar los clculos para la varianza con el comando
VAR.P en Excel.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

40


Ejemplo

Si se quiere escoger una muestra de tamao 3, es decir compuesta por 3
personas y si adems las muestras se toman con reposicin es decir se puede
volver a incluir el individuo. La distribucin muestral ser:


Grfico No.2. Histograma de medias muestrales

El 1,00 que se observa corresponde a la media de la muestra conformada por las
observaciones 1, 1, 1; es decir se tomo una muestra de tres personas pero al ser
con reposicin, el primer elemento que se obtuvo fue 1, ste se devuelve la
poblacin y tiene de nuevo la posibilidad de ser escogido, que es lo que vuelve a
suceder, del mismo modo en la tercera extraccin. El valor 1,33 es la media de
una muestra que puede ser por ejemplo las observaciones 1, 1, 2. El total de
muestras es 24 conformadas por 3 personas, ya que se aplica el principio de las
permutaciones.

Leccin No 7: Distribucin Muestral de la Media y de la
Proporcin

Los estadsticos obtenidos en una muestra son variables aleatorias, por lo cual
deben tener una distribucin de probabilidad, as que la media muestral tiene una
distribucin.
Supongamos que se tiene una muestra de tamao n observaciones tomada de
una poblacin normal N (;
2
) cada observacin X
1
= 1, 2, 3,, n tendr la
misma distribucin que la poblacin de donde fue tomada la muestra.



0
2
4
6
8
10
12
14
1,00 1,33 1,67 2,00 2,33 2,67 3,00 3,33 3,67 4,00
Distribucin de frecuencias de medias
muestrales
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

41


7. Principios y conceptos en la medias muestrales
Teorema: (Poblacin infinita)
-------------------------------------------------------------------------------------------------------
Sea


la media de la muestra aleatoria de tamao n
proveniente de una poblacin infinita de tamao N con media y varianza
2
.
Entonces:
( )
El valor esperado de la media muestral es la media poblacional
()


La varianza del estimador es igual a la varianza poblacional dividida por el tamao
de la muestra.
Teorema: (Poblacin Finita)
-------------------------------------------------------------------------------------------------------

Sea


la media de la muestra aleatoria de tamao n
proveniente de una poblacin finita de tamao N con media y varianza
2
.
Entonces:
( )
()


Comentario:



Se conoce como el factor de correccin para poblaciones finitas. Cuando N es
muy grande comparado con n, la diferencia se hace despreciable lo que origina
que para poblaciones infinitas dicho factor de correccin se hace uno.


7.1. Distribucin Muestral de la Media
Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia,
impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y
tomadas de la misma poblacin tenga la misma media muestral o que sean
completamente parecidas; puede esperarse que cualquier estadstico, como la
media muestral, calculado a partir de las medias en una muestra aleatoria, cambie
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

42


su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de todos
los valores posibles de un estadstico. Tales distribuciones sern muy importantes en
el estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones
se harn usando estadsticas muestrales. Como el anlisis de las distribuciones
asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de un
estadstico muestral como un instrumento para hacer inferencias sobre un parmetro
poblacional desconocido.
Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a
otra, se le puede considerar como una variable aleatoria con su correspondiente
distribucin de frecuencias.
La distribucin de frecuencia de un estadstico muestral se denomina distribucin
muestral. En general, la distribucin muestral de un estadstico es la de todos sus
valores posibles calculados a partir de muestras del mismo tamao.

Figura 8. Distribucin muestral de medias

Ejemplo Construccin de la distribucin de las medias muestrales.

Un Colegio tiene siete profesores, la retribucin por hora ctedra es la que se
muestra a continuacin:

Tabla 5:
Tabla No. Salario profesores
Profesor Salario $
1
2
3
4
5
6
7
7000
7000
8000
8000
7000
8000
9000
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

43








Para determinar la distribucin muestral de las medias, se seleccionaron todas
las muestras posibles de tamao 2, sabiendo que son sin sustitucin y que
no interesa el orden de seleccin en la poblacin. Se calculan las medias de
cada muestra y se calcula la media de las medias muestrales.

Para saber cuntas muestras posibles se pueden tomar, se utiliza la combinatoria,
por los preceptos tomados: Sin repeticin y no importa el orden

El valor de 21, es el nmero de muestras tamao 2 que se pueden formar de
una poblacin de 7 elementos. A continuacin se indican las 21 muestras posibles
y el valor de la media para cada una de las muestras:

72 =
7!
(7 2)! 2!
=
7!
(5)! 2!
=
5! 6 7
5! 2!
=
42
2!
=
42
2
= 21
Paso 1: Media de la poblacin


Paso 2: Varianza de dicha poblacin.

( )

(9 )

99


La varianza poblacional est dada por:
Entonces:
Otra formulacin es:
Recuerde que la desviacin es la raiz cuadrada de la varianza, entonces la
desviavin en este caso es

99 699
Paso 3: Distribucin muestral de las medias

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

44




Tabla 6:
Distribucin salarios de profesores. Muestreo sin reemplazamiento y las medias
Muestra Prof. Salario Media Muestra Prof. Salario Media
1 1 y 2 7000-7000 7000 12 3 y 4 8000-8000 8000
2 1 y 3 7000-8000 7500 13 3 y 5 8000-7000 7500
3 1 y 4 7000-8000 7500 14 3 y 6 8000-8000 8000
4 1 y 5 7000-7000 7000 15 3 y 7 8000-9000 8500
5 1 y 6 7000-8000 7500 16 4 y 5 8000-7000 7500
6 1 y 7 7000-9000 8000 17 4 y 6 8000-8000 8000
7 2 y 3 7000-8000 7500 18 4 y 7 8000-9000 8500
8 2 y 4 7000-8000 7500 19 5 y 6 7000-8000 7500
9 2 y 5 7000-7000 7000 20 5 y 7 7000-9000 8000
10 2 y 6 7000-8000 7500 21 6 y 7 8000-9000 8500
11 2 y 7 7000-9000 8000
Suma Total 162.000

En el cuadro siguiente se indica la distribucin de probabilidad para el
muestreo de medias, donde la sumatoria de todas las probabilidades es igual
a uno:

Tabla 7:
Distribucin de probabilidad
Media muestral Nmero de medias Probabilidad
7000 3 0,1429
7500 9 0,4285
8000 6 0,2857
8500 3 0,1429
Suma 21 1,000

Grfico No.3. Histograma de medias muestrales salario de los profesores

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

45


La media poblacional es igual a la media de las medias muestrales



La media de la distribucin muestral de medias, se determina sumando las
diferentes medias muestrales y dividiendo la suma entre el nmero de muestras.
La media de todas las medias muestrales en general se expresa:






Ecuacin No.2
Primero se obtiene todas las muestras (todos los subconjuntos) y luego a cada
muestra le calcula la media, finalmente obtendr, tantas medias como muestras
haya, y con esas medias calcula de nuevo un promedio; es decir, se calcula una
media de medias.


Vea el valor obtenido en el paso 1 (Media poblacional) y comprelo con el
resultado anterior Son equivalentes!



Note que:

es la media de las medias muestrales y

es la media poblacional.


Por tanto para nuestro caso:









Paso 4: Media de la distribucin muestral de medias

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

46




Paso 5: Construccin de distribucin de errores muestrales


Error Muestral

Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la
media poblacional , entonces la media muestral, como medida, conlleva algn
error. Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de
tamao 25 de una poblacin con media ; si la media de la muestra es
, entonces a la diferencia observada se le denomina
el error muestral. Una media muestral x puede pensarse como la suma de dos
cantidades: la media poblacional y el error muestral; si e denota el error
muestral, entonces:
Ecuacin No.3



Al calcular la media y desviacin estndar de los errores muestrales e (ltima
columna de la tabla 7) se tiene respectivamente:

Se deja como ejercicio al lector calcular



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

47





Tabla 8:
Distribucin de errores muestrales. Salario promedio de profesores

Muestra No.

Media de la muestra


Media de las medias muestrales Error muestral
e
1 7000 7714,3 -714,3
2 7500 7714,3 -214,3
3 7500 7714,3 -214,3
4 7000 7714,3 -714,3
5 7500 7714,3 -214,3
6 8000 7714,3 285,7
7 7500 7714,3 -214,3
8 7500 7714,3 -214,3
9 7000 7714,3 -714,3
10 7500 7714,3 -214,3
11 8000 7714,3 285,7
12 8000 7714,3 285,7
13 7500 7714,3 -214,3
14 8000 7714,3 285,7
15 8500 7714,3 785,7
16 7500 7714,3 -214,3
17 8000 7714,3 285,7
18 8500 7714,3 785,7
19 7500 7714,3 -214,3
20 8000 7714,3 285,7
21 8500 7714,3 785,7

...

9.. 9..

Y otra forma es:



Dnde:

.6 Varianza

Desviacin
Paso 6: Desviacin estndar de las medias muestrales

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

48



Muestreo con reemplazo
Si de una poblacin se eligen muestras de tamao n con
reemplazo (o la poblacin es No finita), entonces el error estndar
de la media es igual a la desviacin estndar de la distribucin de
los errores muestrales.

En general se tiene:


Ecuacin No.4

Muestreo sin reemplazo
Cuando las muestras se toman de una poblacin pequea y sin
reemplazo se puede usar la siguiente frmula para encontrar




Ecuacin No.5





Error estndar del estadstico
La desviacin estndar de la distribucin muestral de un estadstico se conoce
como error estndar del estadstico. Para el ejercicio anterior el error estndar
de la media denotado por

, es 451,75.

Aunque, se puede notar que en este caso la desviacin de los errores
muestrales y el error estndar, son iguales.

: Es llamado factor de correccin para poblaciones finitas, o en donde


se muestrea sin reemplazo.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

49


Ms adelante se ver que, estas dos concepciones hacen parte de los principios
del teorema del lmite central. Para lo cual se desarrollan dos ejemplos, uno de
muestreo con reemplazamiento y otro sin reemplazamiento.


El siguiente es un diagrama de flujo que le permite identificar en que caso debe
usar o no el factor de correccin.























Grfico No.4. Diagrama de flujo para error estndar de la media


Teorema central del lmite.
En el caso de una poblacin con media y varianza
2
o , la distribucin muestral
de medias de todas las muestras posibles de tamao n a partir de la poblacin,
tendr una distribucin aproximadamente normal (siendo la media de la
distribucin muestral igual a y la varianza igual a n /
2
o ) considerando que el
tamao de la muestra es bastante grande.
El teorema central del lmite es uno de los teoremas ms importantes dentro de
Es la poblacin
infinita?
COMIENZO
Se muestrea
con sustitucin?
Es N 20n?


si
si
si
No
No
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

50


las ciencias estadsticas, ya que su funcionalidad es muy grande.







Hay que destacar tres aspectos importantes del teorema central de lmite.
Primer principio:
Si el tamao de la muestra n es suficientemente grande, la distribucin muestral
de las medias ser ms o menos normal. Esto se cumple ya sea que la poblacin
est o no distribuida normalmente. Esto es, el teorema se verifica, ya sea que la
poblacin est distribuida en forma normal, o bien sea sesgada o uniforme.

Segundo principio:
Como se mostr con anterioridad, la media de la poblacin, , y la media de todas
las medias muestrales posibles,
x

, son iguales. Si la poblacin es grande y se


selecciona un nmero grande de muestras de la poblacin, la media de las medias
muestrales se aproximar a la media poblacional.

Tercer principio:
La varianza de la distribucin de medias muestrales se determina de n /
2
o .
No existe acuerdo general sobre lo que constituye un tamao de muestra
suficientemente grande. Algunos estadsticos consideran que es 30; otros
piensan que un nmero pequeo como 12 es adecuado. El ejemplo sobre los
salarios por hora de todos los profesores del colegio funcion bastante bien con
una muestra de 2. Sin embargo, a menos que la poblacin sea aproximadamente
normal, los tamaos de muestra as de pequeos, por lo general no dan como
resultado una distribucin muestral que se distribuya normalmente. A medida que
el tamao de la muestra se vuelve cada vez ms grande, la distribucin de la
media muestral se aproxima ms a la distribucin normal con forma de campana.


TEOREMA CENTRAL DEL LMITE:
Sea X
1
, X
2
,, X
n
una variable aleatoria independiente e
idnticamente distribuida de una poblacin infinita con media y
varianza
2
. Para
2
< , Entonces: Presenta una
distribucin Normal estndar.
O sea:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

51


Ejemplo: Muestreo sin Reemplazamiento

Suponga que se tiene una poblacin conformada por 5 empleados de una
empresa (N = 5), y la variable de inters es el nmero de aos de experiencia
laboral de cada empleado. Los datos de la poblacin son: 5 , 4 , 3 , 2 , 1 =
i
X


3
5
5 4 3 2 1 1
1
=
+ + + +
= =

=
N
i
i
x
N
Promedio de aos de experiencia por empleado.

999 . 1 ) 3 5 ( ... ) 3 2 ( ) 3 1 (
5
1
) (
1
2 2 2
1
2 2
= + + + = =

=
N
i
i
x
N
o
Ahora extraemos la raz cuadrada a la varianza y obtenemos la desviacin
estndar. 414 . 1 = o


Seleccione ahora todas las muestras posibles de tamao dos, sin
reemplazamiento (poblaciones finitas):
Recordar que cuando el muestreo es sin reemplazamiento y no interesa el orden,
entonces tenemos una combinatoria.
( ) ! !
!
xn n N
N
C
N
N

=
Reemplazando:
( ) ( )
10
2 ! 3
! 3 4 5
! 2 ! 3
! 5
! 2 ! 2 5
! 5
5
2
= = =

=
x
x x
x
C

Se tiene 10 muestras posibles de tamao dos. Las posibles muestras se indican a
continuacin:
Tabla 9:
Distribucin de las medias muestrales
Muestra
Media Muestral X
Muestra
Media Muestral X
1 - 2
1 3
1 4
1 5
2 3
1.5
2.0
2.5
3.0
2.5
2 4
2 5
3 4
3 5
4 - 5
3.0
3.5
3.5
4.0
4.5

Paso 1: Media de la poblacin

Paso 2: Varianza de dicha poblacin.

Paso 3: Distribucin muestral de las medias

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

52



3
10
5 . 4 0 . 4 5 . 3 5 . 3 0 . 3 5 . 2 0 . 3 5 . 2 0 . 2 5 . 1
=
+ + + + + + + + +
=
X

Con la informacin anterior se logra demostrar el primer principio del teorema
central del lmite, que consiste en que el promedio de la poblacin es igual al
promedio de la distribucin muestral de medias: 3 = =
X


Observe que dicho principio se ha cumplido, en consideracin a que el promedio
de aos de experiencia para la poblacin es de tres y el promedio de la
distribucin muestral de medias es igual tambin a tres.


Como siempre primero calculamos la varianza y luego la desviacin estndar.

( )
( ) ( ) ( )
7499 . 0
10
0 . 3 5 . 4 3 0 . 2 3 5 . 1
2 2 2
2
2
=
+ + +
=

=


n
X
X
X

o
Ahora extrayendo raz cuadrado a la varianza, obtenemos la desviacin estndar.
8660 . 0 7499 . 0 = =
X
o
Observemos que la desviacin estndar de la poblacin (1.4142) es diferente a la
desviacin estndar de la distribucin muestral de medias (0.8660), y una forma
de corregir esta diferencia es mediante la siguiente igualdad:

1

=
N
n N
n
X
o
o

Ecuacin No.6
Dnde:
X
o Desviacin estndar de la distribucin muestral de medias.
o Desviacin estndar de la poblacin.
n Tamao de la muestra.
N Tamao de la poblacin.
1

N
n N
Factor de correccin para poblaciones finitas.
Paso 4: Media de la distribucin muestral de medias

Paso 6: Desviacin estndar de las medias muestrales

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

53


Reemplazando los valores correspondientes se tiene:
8660 , 0
1 5
2 5
2
4142 , 1
=

=
x
o
El segundo principio del teorema central del lmite para poblaciones finitas se
expresa: La desviacin estndar de la distribucin muestral de medias es igual al
factor de correccin poblacional multiplicada por la relacin entre la desviacin
estndar poblacional y la raz cuadrada del tamao de la muestra. Dicho principio
queda demostrado con la relacin anterior.
Ejemplo: Muestreo con Reemplazamiento

Ahora, cuando el muestreo se realiza para poblaciones finitas, y con reemplazamiento, el
nmero de muestras posibles est dada por:
n
N
Para N = Tamao de la poblacin y n = Tamao de la muestra
El nmero de muestras de tamao dos es: 25 5
2
= =
n
N

Tabla 10:
Distribucin de las medias muestrales
No. muestra Muestra Media muestral No. muestra Muestra Media muestral
1
2
3
4
5
6
7
8
9
10
11
12
13
1-1
1-2
1-3
1-4
1-5
2-1
2-2
2-3
2-4
2-5
3-1
3-2
3-3
1.0
1.5
2.0
2.5
3.0
1.5
2.0
2.5
3.0
3.5
2.0
2.5
3.0
14
15
16
17
18
19
20
21
22
23
24
25
3-4
3-5
4-1
4-2
4-3
4-4
4-5
5-1
5-2
5-3
5-4
5-5
3.5
4.0
2.5
3.0
3.5
4.0
4.5
3.0
3.5
4.0
4.5
5.0


3
25
0 . 5 5 . 4 0 . 4 5 . 2 0 . 2 5 . 1 0 . 1
=
+ + + + + + +
=

X

El primer principio se mantiene, en el sentido, que la media poblacional es igual a
la media de la distribucin muestral de medias.
Paso 3: Distribucin muestral de las medias

Paso 4: Media de la distribucin muestral de medias

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

54



( )
( ) ( ) ( ) ( )
0 . 1
25
0 . 3 0 . 5 0 . 3 5 . 4 3 5 . 1 3 1
2 2 2 2
2
=
+ + + +
=

=


n
X
X
X

o
Observe que la desviacin estndar de la poblacin (1.4142) sigue siendo
diferente a la desviacin estndar de la distribucin muestral de medias (1.0)

La forma de corregir esta diferencia para poblaciones no finitas es mediante la
siguiente igualdad:

n
X
o
o =
Correccin para poblaciones no finitas
Reemplazando en el caso que nos ocupa:
1
2
41421356 . 1
= =
x
o


Para qu me sirve conocer la distribucin muestral de las medias?
Recordemos que se puede calcular la probabilidad de algn
evento relacionado con la variable aleatoria que se distribuye
normal, mediante la siguiente frmula:

(lo que se conoce como estandarizacin)


Para transformar una variable normal general en una normal estndar (este
proceso se llama tipificar) se debe:

X ~ N (,

~ N(0,1)
Ejemplo

a) Probabilidad acumulada en el valor 0,67: la respuesta es 0,7486
b) Probabilidad acumulada en el valor 1,35: la respuesta es 0,9115
c) Probabilidad acumulada en el valor 2,19: la respuesta es 0,98574

La dcima del valor buscado (por ejemplo en 0.67, es 0.6) le indica el valor a
buscar en la primera columna; luego use la centsima para ubicarse en la primera
fila (por el ejemplo en 0.67, es 7); finalmente la interseccin de esas dos hileras es
la probabilidad buscada.



Paso 6: Desviacin estndar de las medias muestrales

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

55





Grfico No 5. Ejemplo de uso de la tabla normal
Veamos ahora, como podemos utilizar la tabla de una distribucin
normal:





As mismo, las medias muestrales se distribuyen como una normal, por tanto, se
puede calcular la probabilidad del comportamiento del estadstico, en este caso la
media de la muestral, de la siguiente manera:
Poblaciones infinitas (o no se conoce):

Ecuacin No.7
Poblaciones finitas y muestreo con reemplazo:

Ecuacin No.8

Ejemplo

Clculo de Probabilidades. Distribucin de medias
Poblaciones infinitas (o no se conoce)
La altura media de los alumnos de un plantel de secundaria es de 1,50 mts. Y su
desviacin tpica es de 0,25 mts. Determinar la probabilidad de que en una
muestra de 36 alumnos, la media sea superior a 1,60 mts.
P( X > 1,60) = ?
Se estandariza la variable (aplicar ecuacin 3):
40 , 2
25 , 0
60 , 0
6
25 , 0
10 , 0
36
25 , 0
50 , 1 60 , 1
= = =

= Z
Clic para ver Video:
Uso de la tabla normal

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

56


Ahora la pregunta queda convertida en: P(Z> 2,40)
O su equivalente: 1- P(Z< 2,40) =?
Si se observa en la tabla de la normal, P(Z< 2,40) = 0,9918,

Entonces

1- P(Z< 2,40) = 1 0,9918 = 0,0082 = 0,8%
Entonces al tomar una muestra la probabilidad de que la media muestral de la
estatura sea superior a 1,60 es 0,8%, es decir, menos del 1%.

Ejemplo
Clculo de Probabilidades. Distribucin de medias
Poblaciones finitas y muestreo con reemplazo
Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviacin
estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de
16 focos tenga una vida promedio de menos de 775 horas.
Se estandariza la media muestral (se aplica la ecuacin 4):

6

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

57


es equivalente:

Este valor se busca en la tabla de z

La interpretacin sera que la probabilidad de que la media de la muestra de 16
focos sea menor a 775 horas es de 0.0062.

7.1.1. Distribucin Muestral de Medias: Poblaciones Finitas:
Las poblaciones finitas, tiene la caracterstica de que N es conocido, al hacer la
distribucin muestral de las medias y muestreo sin reemplazamiento, se obtiene
una grfica de la distribucin que presenta una forma aproximadamente
acampanada, lo cual se puede observar en la siguiente grfica.
















Figura 9. Distribucin Muestral de Medias: Poblaciones Finitas

7.1.2. Distribucin Muestral de Medias: Poblaciones No Finitas:
La grfica de la distribucin muestral de medias para poblaciones no finitas y
muestreo con reemplazamiento tiene una distribucin normal, tal como se puede
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

58


observar a continuacin:



Figura 10. Distribucin muestral de medias: Poblaciones No Finitas:

Entonces:


Leccin No 8: Distribucin Muestral de la proporcin

8. Distribucin muestral de proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la
muestra, sino que deseamos investigar la proporcin de artculos defectuosos o
la proporcin de personas con telfono, etc en la muestra.
La distribucin muestral de proporciones es la adecuada para dar respuesta a
estas situaciones.

Esta distribucin se genera de igual manera que la distribucin muestral de
medias, a excepcin de que se calcula la proporcin en la poblacin y no la
media (paso 1) ese clculo corresponde a P = A /N, en donde A es el total de
elementos con la caracterstica en la Poblacin y N el tamao de la poblacin.
As mismo, al extraer las muestras de la poblacin se calcula el estadstico
proporcin (p= a / n en donde a es el nmero de xitos u observaciones de
inters y n el tamao de la muestra, en lugar de la media de cada muestra que
era lo que se calcula antes. (Curso de Estadstica 1. Pgina web, Instituto
Tecnolgico De Chihuahua). Ir a la pgina.
No importa que distribucin tenga la poblacin, pero la distribucin muestral de
medias a partir de esa poblacin, tiene una distribucin normal
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

59



Ahora bien, se debe tener en cuenta que cuando se hace anlisis de una
caracterstica cualitativa o atributo, se emplea la proporcin de xitos y no el
nmero de xitos como en la distribucin binomial.

Una distribucin es una distribucin total de xitos en las muestras, mientras que
una distribucin de proporciones es la distribucin de un promedio (media) de los
xitos.


Figura 11. Distribucin muestral de proporciones
Imagen extrada de: http://www.itch.edu.mx/academic/industrial/estadistica1/img/image802.gif
Ejemplo

Construccin de la distribucin de las proporciones muestrales.
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos
defectuosos. Se van a seleccionar 5 artculos al azar de ese lote sin reemplazo.
Genere la distribucin muestral de proporciones para el nmero de piezas
defectuosas.






Paso 1: Proporcin Poblacional



Por lo que podemos decir que el 33% de las piezas de este lote estn
defectuosas.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

60








Paso 2: Distribucin muestral de proporciones

El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12
elementos es
12
C
5
=792, las cuales se pueden desglosar de la siguiente
manera:
Tabla 11:
Distribucin de proporciones
Artculos
Buenos
Artculos Malos Proporcin de
artculos
defectuoso
Nmero de
maneras en las que
se puede obtener la
muestra
1 4 4/5=0.8
8C1*4C4=8
2 3 3/5=0.6
8C2*4C3=112
3 2 2/5=0.4
8C3*4C2=336
4 1 1/5=0.2
8C4*4C1=280
5 0 0/5=0
8C5*4C0=56

Total 792

Grfico 6. Frecuencias para las proporciones de las muestras

Paso 3: Media de la distribucin muestral de proporciones

( ) (6 ) ( 6) ( ) ( 6)
9


Para calcular la media de la distribucin muestral de proporciones se tendra
que hacer la sumatoria de la frecuencia por el valor de la proporcin muestral y
dividirla entre el nmero total de muestras. Esto es:
Como podemos observar la media de la distribucin muestral de proporciones
es igual a la Proporcin de la poblacin.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

61







Error estndar del estadstico
La desviacin estndar de la distribucin muestral de un estadstico se conoce
como error estndar del estadstico. Para el ejercicio anterior el error estndar
de la proporcin denotado por

, es 0,1681
La varianza de la distribucin binomial es

, por lo que la varianza de la


distribucin muestral de proporciones es

.
Ecuacin No.9
Si se sustituyen los valores en esta frmula tenemos que:

)(


Este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de
correccin para una poblacin finita y un muestreo sin reemplazo:




Ecuacin No.10
Lo que da como resultado:

)(

6


Paso 4: Desviacin estndar de la distribucin muestral de proporciones

(6

6 (

6
9

6
Tambin se puede calcular la desviacin estndar de la distribucin muestral
de proporciones, directamente con los datos:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

62



Para qu me sirve conocer la distribucin muestral de las proporciones?
Recordemos que se puede calcular la probabilidad. La frmula
que se utilizar para el clculo de probabilidad en una
distribucin muestral de proporciones est basada en la
aproximacin de la distribucin normal a la binomial. Esta
frmula nos servir para calcular la probabilidad del
comportamiento de la proporcin en la muestra.


Ecuacin No.11
A esta frmula se le puede agregar el factor de correccin

si se cumple con
las condiciones necesarias.


Ejemplo

Clculo de Probabilidades. Distribucin de proporciones muestrales
Cuarenta y seis por ciento de los sindicatos del pas estn en contra de comerciar
con la China Continental; Cul es la probabilidad de que en una encuesta a 100
sindicatos muestre que ms del 52% tengan la misma posicin?
P = 0,46 p = 0,52 n = 100 P(p>0,52) = ?
( )( )
21 , 1
100
2484 , 0
06 , 0
100
54 , 0 46 , 0
46 , 0 52 , 0
= =

=
n
PQ
P p
Z

P ( z > 1,21) = 0,1131 P (p > 0,52) = 11,31%









UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

63



Leccin No 9: Distribucin Muestral de Diferencias de Medias y
de la Proporciones

9. Dos poblaciones.
En esta seccin es importante destacar que ya no se trabaja con una sola
poblacin sino con dos, de las cuales se extraen muestras respectivamente para
ser analizadas y que permitan inferir y comparar las dos poblaciones.
9.1. Distribucin Muestral de Diferencia de Medias
Suponga que se tienen dos poblaciones distintas, la primera con media

y
desviacin estndar

, y la segunda con media



y desviacin estndar
.
Ms
an, se elige una muestra aleatoria de tamao n
1
de la primera poblacin y una
muestra independiente aleatoria de tamao n
2
de la segunda poblacin; se calcula
la media muestral para cada muestra y la diferencia entre dichas medias. La
coleccin de todas esas diferencias se llama distribucin muestral de las
diferencias entre medias o la distribucin muestral del estadstico



Figura 11. Distribucin muestral de diferencia de medias

Imagen tomada de:
http://www.itch.edu.mx/academic/industrial/estadistica1/img/image811.gif

La distribucin es aproximadamente normal para n
1
30 y n
2
30. Si las
poblaciones son normales, entonces la distribucin muestral de medias es normal
sin importar los tamaos de las muestras. En ejercicios anteriores se haba
demostrado que


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

64


As que:


Ecuacin No.12


Ecuacin No.13
La frmula que se utilizar para el clculo de probabilidad del estadstico de
diferencia de medias es:

(

) (


Ecuacin No.14

Ejemplo

Clculo de Probabilidades. Distribucin de diferencia de medias
muestrales
El rendimiento de los autos de la marca A es de 20 kilmetros por galn de
gasolina (k.p.g), con una desviacin estndar de 6 k.p.g. las cifras comparables
para los autos B son de 25 y 5,5 k.p.g. se supone que el rendimiento de cada una
de ambas marcas est normalmente distribuido. cul es la probabilidad de que
en un concurso, el rendimiento medio para 10 autos de la marca A sea mayor que
el de 9 autos de la marca B?
x
= 20
y
= 25
x
o = 6
y
o = 5,5
1
n = 10
2
n = 9
P( y x > 0) = ?
( ) ( )
90 , 1
96 , 6
5
36 , 3 6 , 3
5 0
9
25 , 30
10
36
25 20 0
= =
+

=
+

= Z
P( y x > 0) = 0,5000 - 0,4713 = 0,0287 = 2,87%


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

65



9.2. Distribucin muestral de diferencias de dos proporciones
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben
compararse utilizando proporciones o porcentajes. A continuacin se citan algunos
ejemplos:
- Educacin.- Es mayor la proporcin de los estudiantes que aprueban
matemticas que las de los que aprueban ingls?
- Medicina.- Es menor el porcentaje de los usuarios del medicamento A que
presentan una reaccin adversa que el de los usuarios del frmaco B que
tambin presentan una reaccin de ese tipo?
- Administracin.- Hay diferencia entre los porcentajes de hombres y
mujeres en posiciones gerenciales.
- Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos
que genera la mquina A a los que genera la mquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos
proporciones muestrales, la distribucin muestral de diferencia de proporciones es
aproximadamente normal para tamaos de muestra grande (n
1
p
1
5, n
1
q
1
5,n
2
p
2
5 y n
2
q
2
5). Entonces p
1
y p
2
tienen distribuciones muestrales aproximadamente
normales, as que su diferencia p
1
-p
2
tambin tiene una distribucin muestral
aproximadamente normal.

Figura 12. Distribucin muestral de diferencia de proporciones

Imagen tomada de:
http://www.itch.edu.mx/academic/industrial/estadistica1/img/image816.gif
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

66


En el caso de dos poblaciones independientes de tamao
1
N y
2
N , distribuidas
binomialmente, con parmetros, medias poblacionales
1
P y
2
P (tambin se
pueden representar las medias por
1
P
y
2
P
) y desviaciones proporcionales
1
P
o y
2
P
o , siendo:
1 1
1
Q P
P
= o y
2 2
2
Q P
P
= o .
El error estndar de las diferencias entre las dos medias proporcionales estar
dada por:
2
2 2
1
1 1
2 1
n
Q P
n
Q P
P P
+ =

o Cuando son valores poblacionales


Cuando
1
n y
2
n corresponden a muestras grandes, es decir, ambas superiores a
30:
2
2 2
1
1 1
2 1
n
q p
n
q p
s
P P
+ =


La media de las diferencias entre dos medias proporcionales, se simboliza por:
2 1
2 1 2 1
P P
P P P P
= =


La variante estadstica Z, estar dada en la misma forma en que fue presentada
para diferencias entre dos medias mustrales:
( ) ( )
( ) ( )
2
2 2
1
1 1
2 1 2 1
2
2 2
1
1 1
2 1
2 1
n
q p
n
q p
P P p p
n
Q P
n
Q P
p p
Z
P P
+

=
+

=

cuando
1
n y
2
n > 30
Ejemplo

Clculo de Probabilidades. Distribucin de diferencia de proporciones muestrales
Consideremos dos mquinas que producen un determinado artculo, la primera
produce por trmino medio un 14% de artculos defectuosos, en tanto que otra,
produce el 20% de artculos defectuosos; si se obtienen muestras de 200
unidades en la primera y 100 unidades en la segunda, Cul es la probabilidad
que difiera A de B en 8% o ms?
P( 08 , 0
2 1
> P P ) = ?
1
n = 200
2
n = 100
1
P = 0,14
2
P = 0,20
2 1
P P
= 0,14 0,20 = -0.06
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

67


2 1
p p = 8% = 0,08
( )
( ) ( )
98 , 2
047 , 0
14 , 0
100
8 , 0 2 , 0
200
86 , 0 014
06 , 0 08 , 0
= =
+

= Z
P( 08 , 0
2 1
> P P ) = 0,0014 = 0,14%

Leccin No 10: Tamao de la muestra para estimar la media, la
proporcin y el total de la Poblacin

10. Tamao de muestra
En el apartado anterior se analiz la forma de estimar los parmetros de la
poblacin: P t o
2
Promedio, Varianza, total y proporcin poblacional
respectivamente. Pero siempre que se realiza una investigacin se debe definir el
tamao de la muestra. Tomar observaciones para una muestra cuesta dinero, por
lo cual se debe tomar la muestra adecuada, que de la informacin necesaria y a
costos razonables. Una muestra mal tomada arroja informacin inadecuada, lo
que hace perder tiempo y dinero.
10.1. Tamao de la Muestra para estimar :
Determinar el nmero de observaciones que harn parte de la muestra, para
estimar , con un lmite de estimacin B definido, se obtiene a partir de la
ecuacin del error de estimacin.
10.1.1. Para poblaciones Finitas y Varianza Poblacional Conocida:
|
.
|

\
|

|
|
.
|

\
|
=

1
2
) 2 / 1 (
N
n N
n
Z B
o
o

Ecuacin No.15
Despejando n, se obtiene:
2 2 2
2 2
) 2 / 1 (
) 1 ( o
o
o
Z B N
N Z
n
+
=


Ecuacin No.16

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

68


Ejemplo

Un Banco desea identificar el promedio de cuentas por cobrar, estudios previos
han determinado que la variacin de las cuentas est en $1.000. El Banco cuenta
con 1.400 clientes activos. Si el lmite de error de estimacin es de $50 Cul
debe ser el tamao de la muestra a un nivel de significancia del 5%?
Se trata de una poblacin finita. Por teora la amplitud de variacin es 4 veces la
desviacin tpica: A = 4 entonces: = A/4 = 1.000/4 = 250
Z
(1-/2)
= Z
0,975
= 1,96

2 2 2
2 2
2 2 2
2 2
) 2 / 1 (
) 250 ( ) 96 , 1 ( ) 50 )( 1 1400 (
400 . 1 ) 250 ( ) 96 , 1 (
) 1 ( +
=
+
=

o
o
o
Z B N
N Z
n

93 , 89
100 . 240 500 . 497 ' 3
000 . 140 ' 336
) 250 ( ) 96 , 1 ( ) 50 )( 1 1400 (
400 . 1 ) 250 ( ) 96 , 1 (
2 2 2
2 2
=
+
=
+
= n

En las condiciones dadas, la muestra debe ser de n = 90 cuentas.

10.1.2. Para Poblaciones Infinitas y Varianza Poblacional Conocida:
Cuando N es muy grande, se asume una poblacin infinita, en estos casos N
1 se aproxima a N, entonces N n ~ N, as se puede obtener el tamao de una
muestra para poblaciones infinitas.
n
Z B
2
) 2 / 1 (
o
o
=

Ecuacin No.17
Entonces:
2
2 2
) 2 / 1 (
B
Z
n
o
o
=

Ecuacin No.18
Ejemplo

En un estudio sobre el tamao de las manos para el diseo de guantes, se
estableci que la longitud de estas sigue una distribucin normal. Por datos
conocidos se sabe que la desviacin tpica es de 1,5 cm. Cul ser el tamao de
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

69


la muestra para estimar el promedio de la longitud de los guantes, si se asume un
error de estimacin de 0,5 cm. y un nivel de significancia del 5%?
Z
(1-/2)
=Z
0,975
= 1,96
B = 0,5 y = 1,5
Segn el problema la poblacin es infinita, entonces:
57 , 34
) 5 , 0 (
) 5 , 1 ( ) 96 , 1 (
2
2 2
2
2
) 2 / 1 (
= = =

B
Z
n
o
o

En tamao requerido para estimar la media de la longitud de los guantes, con un
error de estimacin de 0,5 cm. y un nivel de significancia del 5% debe ser de n =
35 observaciones.
10.2. Tamao de la Muestra para estimar P:
En muchos estudios el Investigador est interesado en estimar la proporcin de
poblacin que tienen la caracterstica, como la proporcin de dietas preparadas
del total de dietas planeadas, la proporcin de aves con un peso definido respecto
al total de aves pesadas, el porcentaje de personas que observan un programa de
televisin respecto al total de la poblacin potencial que puede ver la televisin.
Dichos fenmenos son de tipo binomial.
Se sabe que:

=
=
n
i
i
y
n
p
1
1
Para y
i
= 1.
El nmero de observaciones necesarias para estimar la proporcin poblacional,
con un lmite de error de estimacin asumido B y un nivel de significancia
definido, est dado a partir de la ecuacin del error de estimacin.
|
.
|

\
|
|
.
|

\
|

=

N
n N
n
q p
Z B
1
*
) 2 / 1 (

o

Ecuacin No.19
Despejando n se obtiene:
q p Z NB
NB N q p Z
n


*
*
2
) 2 / 1 (
2
2 2
) 2 / 1 (
o
o

+
+
=

Ecuacin No.20
NOTA: Cuando no se conoce o no se puede determinar el valor de p, entonces se
asume como un caso dudoso y en estos casos p = 0,5
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

70


Ejemplo

En una ciudad se desea realizar una encuesta para determinar la proporcin de
habitantes que estn de acuerdo con el consumo de cigarrillo. La ciudad tiene
7.500 habitantes y por estudios previos se ha determinado que de cada 100
habitantes, 15 estn de acuerdo. Cul debe ser el tamao de la muestra para
estimar la proporcin poblacional P; con un lmite de error de estimacin de 0,05 y
un nivel de significancia del 5%.
Por los datos:
15 , 0
100
15
= = p

Luego 85 , 0 15 , 0 1 = = q


Aplicando la ecuacin correspondiente:
) 85 , 0 )( 15 , 0 ( ) 96 , 1 ( ) 05 , 0 )( 500 . 7 (
) 05 , 0 )( 500 . 7 ( ) 500 . 7 )( 85 , 0 )( 15 , 0 ( ) 96 , 1 (
*
*
2 2
2 2
2
) 2 / 1 (
2
2 2
) 2 / 1 (
+
+
=
+
+
=

q p Z NB
NB N q p Z
n


o
o

4898 , 0 75 , 18
75 , 18 53 , 3673
) 85 , 0 )( 15 , 0 ( ) 96 , 1 ( ) 05 , 0 )( 500 . 7 (
) 05 , 0 )( 500 . 7 ( ) 500 . 7 )( 85 , 0 )( 15 , 0 ( ) 96 , 1 (
2 2
2 2
+
+
=
+
+
= n
908 , 191
2398 , 19
28 , 3692
4898 , 0 75 , 18
75 , 18 53 , 3673
= =
+
+
= n

Por consiguiente se debe tomar una muestra de 192 habitantes para estimar la
proporcin poblacional, con un lmite de error de 0,05 y un nivel de confianza de
95%.
Ejemplo

En una compaa de 3.500 empleados, se desea saber la proporcin de
empleados que estn a favor de la organizacin de un Sindicato. El investigador
tomo una muestra de 400 empleados fruto del clculo respectivo; adems, asume
un nivel del 5%. Por ser una compaa relativamente nueva, NO hay datos al
respecto. De qu valor fue tomado el error de estimacin del muestreo?
Inicialmente por no conocer proporciones anteriores, entonces se asume un
fenmeno dudoso, as p = 0,5 luego q = 0,5. Conocemos el tamao de la
poblacin y de la muestra. Debemos despejar B de la ecuacin del tamao
muestral.
q p Z NB
NB N q p Z
n


*
*
2
) 2 / 1 (
2
2 2
) 2 / 1 (
o
o

+
+
=
Despejando B:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

71


500 . 3 500 . 3 * 400
000 . 4 * 5 , 0 * 5 , 0 * ) 96 , 1 ( 500 . 3 * 5 , 0 * 5 , 0 * ) 96 , 1 (
* *
2 2
2
) 2 / 1 (
2
) 2 / 1 ( 2

=

N nN
n q p Z N q p Z
B

o o

002132 , 0
500 . 396 ' 1
24 , 977 . 2
500 . 3 500 . 3 * 400
000 . 4 * 5 , 0 * 5 , 0 * ) 96 , 1 ( 500 . 3 * 5 , 0 * 5 , 0 * ) 96 , 1 (
2 2
2
= =

= B
04617 , 0 002132 , 0 = = B
El error de estimacin tomado fue casi de 0,04617, es decir casi 0,05
Ejemplos

1. El mantenimiento de cuentas puede resultar demasiado costoso, si el promedio
de compra por cuenta baja de cierto nivel. El gerente de un gran almacn por
departamentos desea estimar el promedio de lo comprado mensualmente por los
clientes que usan la cuenta de crdito, con un error de $1.500, y una probabilidad
aproximada de 0,95. Cuntas cuentas deber seleccionar, si sabe que la
desviacin estndar es de $30.000, la cual fue obtenida de los balances
mensuales de la cuenta de crdito?
n =
2
2 2
E
Z o
=
( )
2
2 2
500 . 1
000 . 30 2
= 1.600 cuentas se deben seleccionar
2. un auditor desea tener un nivel de confianza del 95%, para que la verdadera
proporcin de error no exceda del 2%. Si la poblacin es muy grande, Qu
tamao tendr la muestra que va a tomarse, si el auditor estima que la proporcin
de error es del 5%?
n =
2
2
E
PQ Z
=
( )( )
2
2
02 , 0
95 , 0 05 , 0 2
= 475 cuentas
Calculo de n en poblaciones finitas
La frmula ms utilizada para el tamao ptimo en el muestreo aleatorio simple,
cuando la poblacin es finita, se obtiene:
n =
N
n
n
o
o
+ 1
donde:
2
2 2
E
Z
n
o
o
= En variables
n =
N
n
n
o
o
+ 1
donde:
2
2
E
PQ Z
n
o
= En proporciones
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

72


10.3. Tamao de la Muestra para estimar :
El nmero de observaciones necesarias para estimar , el total poblacional, con
un lmite de error de estimacin asumido B y un nivel de significancia definido,
est dado a partir de la ecuacin del error de estimacin, partiendo que se conoce
la varianza poblacional.
|
.
|

\
|

|
|
.
|

\
|
=

1
2
2
) 2 / 1 (
N
n N
n
N Z B
o
o

Ecuacin No.21
Despejando n se obtiene:
2 2 2
) 2 / 1 (
2
2 3 2
) 2 / 1 (
) 1 ( N Z B N
N Z
n
o
o
o
o

+
=

Ecuacin No.22
Ejemplo

Una compaa que hace estudios a nivel social, desea estimar el total de ingresos
de una poblacin de 3.000 habitantes que tiene ingresos. Por estudios previos se
sabe que la varianza poblacional para los ingresos es de $40.000 Cuntas
personas se deben tomar como muestra, si se asume un lmite de error de
estimacin de $100.000 y un nivel de confianza del 95%?
Los datos:
N = 3.000

2
= 40.000
B = 100.000
Entonces:
2 2 2
) 2 / 1 (
2
2 3 2
) 2 / 1 (
) 1 ( N Z B N
N Z
n
o
o
o
o

+
=
Para Z
(1-/2)
= Z
0,975
= 1,96 Reemplazando en la ecuacin:
000 . 40 ) 000 . 3 ( ) 96 , 1 ( ) 000 . 100 )( 1 000 . 40 (
000 . 40 ) 000 . 3 ( ) 96 , 1 (
2 2 2
3 2
+
= n

281 , 7
10 01372976 , 4
10 9225 , 2
10 382976 , 1 10 9999 , 3
10 148928 , 4
14
15
12 14
15
= =
+
=
X
X
X X
X
n
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

73


Por consiguiente para estimar el promedio de ingresos de la poblacin objeto de
estudio, con un nivel de confianza del 95% y el error de estimacin de $40.000, se
debe tomar una muestra aleatoria de 8 personas.
10.4. Tamao de muestra para la diferencia de dos medias
Para calcular los tamaos de muestras en estos casos, se presentan dos
situaciones:
- Tamaos de muestras iguales
- Tamaos de muestras diferentes
Para el primer caso no se tiene ningn problema porque al ser n
1
sera igual n
2

Se calcula una sola muestra de tamao n


Ecuacin No.23
Para el segundo caso se calcula una n en funcin de la otra as.


Ecuacin No.24
10.5. Tamao de muestra para la diferencia de dos proporciones
En este caso se calculan los tamaos con los mismos criterios anteriores, es decir
para muestras de igual tamao y tamaos desiguales, as:
Tamaos Iguales:


Ecuacin No.25
Tamaos Desiguales:


Ecuacin No.26

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

74



CAPITULO TRES: INTERVALOS DE CONFIANZA
Introduccin
El problema que presenta la estimacin puntual de un parmetro reside en que
no garantiza ni mide la precisin de la estimacin. Slo la bondad de ajuste y el
tamao de la muestra pueden proporcionar una mayor o menor confianza en la
estimacin obtenida. Por esta razn es necesario dar, junto a la estimacin, una
medida del grado de confianza que se merece, la cual se consigue mediante un
intervalo de confianza que proporcione unos lmites dentro de los cuales se
confa est el valor desconocido del parmetro. Esta confianza de inclusin se
mide mediante un porcentaje.
Con frecuencia se encuentra informacin como la siguiente:
El peso de un objeto es 104 ms o menos 2 gramos.
El dimetro de un tornillo es de 8 ms o menos 0.05 milmetros.
El contenido de protenas de la carne de pollo es de 20.2 ms o menos 1%.

En estos casos y otros similares se quiere indicar que la media verdadera se
encuentra en algn lugar entre el intervalo.

Lo anterior indica que existe la probabilidad de error en la medicin y adems no
se puede estar absolutamente seguro que el verdadero valor se encuentre
dentro del intervalo obtenido. Ntese que si el intervalo se hace ms amplio
aumenta la posibilidad que se incluya el verdadero valor de la media.

Objetivo general

Mostrar los diferentes mtodos para calcular los intervalos de confianza, a partir
de muestras grandes y pequeas, para estimar los parmetros poblacionales de
una media y proporcin, as como para la diferencia de medias y proporciones.

Objetivos especficos
Calcular el intervalo de confianza para estimar el parmetro poblacional a
partir de muestras pequeas, para una media y una proporcin.
Calcular el intervalo de confianza para estimar el parmetro poblacional a
partir de muestras grandes, para una media y una proporcin.
Calcular el intervalo de confianza para la diferencia de dos medias y dos
proporciones.
Exponer el uso de clculo de intervalos de confianza utilizando paquetes de
Excel y SSPS.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

75


Leccin No 11: Nociones Fundamentales.

En estadstica muchos problemas exigen construir conjuntos (intervalos) que
contengan el verdadero valor del parmetro en estudio con una probabilidad
dada generalmente alta. Si por ejemplo X representa los grados de grasa de
una margarina se puede estar interesado en encontrar los lmites bajos y altos
aceptables para este tipo de producto; pero no se puede asegurar con
probabilidad de uno que el verdadero valor se encuentre entre estos dos lmites,
lo mximo que se puede lograr es elegir un nmero uno menos alfa ( 1 o ) que
est muy prximo a uno (recuerde que alfa es el nivel de significacin o error
tipo uno) tal que la probabilidad que el verdadero valor se encuentre entre estos
dos lmites inferior y superior sea mayor o igual a uno menos alfa.

En la prctica se elige un alfa fijo generalmente pequeo 0.01 o 0.05. La
probabilidad que la afirmacin del intervalo incluya al parmetro sea cierta es
por lo menos
(1 o ) ; por lo tanto la probabilidad que la afirmacin sea falsa es
por lo ms un alfa. Un intervalo de confianza dado que incluya o no el verdadero
valor del parmetro, esto nunca se conoce con exactitud al menos que se
conozca el parmetro, pero se sabe que se tendr xito en encontrar el valor
verdadero del parmetro dentro de este tipo de intervalos por lo menos en el
(1 o ) 100% de las veces.


Los dos tipos de problemas que resuelven las tcnicas estadsticas son:
estimacin y contraste de hiptesis. En ambos casos se trata de generalizar la
informacin obtenida en una muestra a una poblacin. Estas tcnicas exigen
que la muestra sea aleatoria. En la prctica rara vez se dispone de muestras
aleatorias, por la tanto la situacin habitual es la que se esquematiza en la figura




Figura 13. Estimacin
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

76


Entre la muestra con la que se trabaja y la poblacin de inters, o poblacin
diana, aparece la denominada poblacin de muestreo: poblacin (la mayor parte
de las veces no definida con precisin) de la cual nuestra muestra es una
muestra aleatoria. En consecuencia la generalizacin est amenazada por dos
posibles tipos de errores: error aleatorio que es el que las tcnicas estadsticas
permiten cuantificar y crticamente dependiente del tamao muestral, pero
tambin de la variabilidad de la variable a estudiar y el error sistemtico que
tiene que ver con la diferencia entre la poblacin de muestreo y la poblacin
diana y que slo puede ser controlado por el diseo del estudio.

11. Estimacin.
El objetivo principal de la estadstica inferencial es la estimacin, esto es que
mediante el estudio de una muestra de una poblacin se quiere generalizar las
conclusiones al total de la misma. Como vimos en la seccin anterior, los
estadsticos varan mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estndar de un estadstico, ms cercanos sern unos de otros
sus valores.

Grfico No.7 Estimacin
La inferencia estadstica est casi siempre concentrada en obtener algn tipo de
conclusin acerca de uno o ms parmetros (caractersticas poblacionales). Para
hacerlo, se requiere que un investigador obtenga datos muestrales de cada una de
las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en
los valores calculados de varias cantidades muestrales. Por ejemplo,
representamos con (parmetro) el verdadero promedio de resistencia a la
ruptura de conexiones de alambres utilizados para unir obleas de
ESTIMACION
Puntual:
Una estimacin puntual es un nico
valor estadstico y se usa para estimar un
parmetro. El estadstico usado se
denomina estimador
Por intervalos:
Una estimacin por intervalo es un rango,
generalmente de ancho finito, que se espera
que contenga el parmetro, de la forma (a, b)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

77


semiconductores. Podra tomarse una muestra aleatoria de 10 conexiones para
determinar la resistencia a la ruptura de cada una, y la media muestral de la
resistencia a la ruptura se poda emplear para sacar una conclusin acerca del
valor de . De forma similar, si

es la varianza de la distribucin de resistencia a


la ruptura, el valor de la varianza muestral s
2
se podra utilizar para inferir algo
acerca de

.
11.1. Estimacin puntual
Cuando se analizan conceptos generales y mtodos de inferencia es conveniente
tener un smbolo genrico para el parmetro de inters. Se utilizar la letra
griega para este propsito. El objetivo de la estimacin puntual es seleccionar
slo un nmero, basados en datos de la muestra, que represente el valor ms
razonable de .
Una estimacin puntual de un parmetro es un slo nmero que se puede
considerar como el valor ms razonable de . La estimacin puntual se obtiene al
seleccionar una estadstica apropiada y calcular su valor a partir de datos de la
muestra dada. La estadstica seleccionada se llama estimador puntual de .
El proceso de estimacin conlleva a obtener un estimador que tenga ciertas
condiciones deseables para hacer inferencia sobre el modelo de probabilidad que
ha generado los datos. Entre los mtodos de estimacin de la estadstica
paramtrica, se tiene: Momentos, mnimos cuadrados y mxima verosimilitud.

Grfico No.8 Estimacin puntual


ESTIMACIN PUNTUAL
Una estimacin puntual es un nico valor estadstico y se usa para
estimar un parmetro. El estadstico usado se denomina estimador
Media
poblacional
Proporcin
Total
poblacional
De
proporciones
Diferencias de
medias
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

78


11.2. Intervalos de confianza
Es un conjunto de valores formado a partir de una muestra de datos, de forma que
exista la posibilidad de que el parmetro poblacional se encuentre en dicho
intervalo, cuyos extremos son aleatorios; con una probabilidad especifica que
efectivamente se encuentre all el parmetro, llamada nivel de confianza (NC).
La estimacin por intervalo se calcula al sumar o restar al estimador puntual una
cantidad llamada margen de error. La frmula general de una estimacin por
intervalo es:


Dependiendo del estadstico a usar el margen de error puede ser:
Tabla 12:
Margen de error
MARGEN DE ERROR
Se conoce la varianza
Poblacional
Estadstico
Si No
Media
(

) (

)

Grfico No.9 Intervalos de confianza
Clic ac para ver Recurso: Mapas conceptuales intervalos de confianza
INTERVALOS DE
CONFIANZA
UNA POBLACIN
MUESTRAS
GRANDES n
>=30
Proporcin
Media
MUESTRAS
PEQUEAS
n<30
Media
DOS
POBLACIONES
MUESTRAS
GRANDES n>=30
Diferencia de
medias
Diferencia de
proporciones
MUESTRAS
PEQUEAS n<30
Diferencia de
medias
VARIANZA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

79


Tabla 13. Valores de Z
o
y Z
|
ms frecuentemente utilizados
Za
o Test unilateral Test bilateral
0.200
0.150
0.100
0.050
0.025
0.010
0.842
1.036
1.282
1.645
1.960
2.326
1.282
1.440
1.645
1.960
2.240
2.576
Potencia
| (1-|) Zb
0.01
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
0.99
0.95
0.90
0.85
0.80
0.75
0.70
0.65
0.60
0.55
0.50
2.326
1.645
1.282
1.036
0.842
0.674
0.524
0.385
0.253
0.126
0.000

Nivel de Confianza y significancia.
La probabilidad de que el verdadero valor del parmetro se encuentre en el
intervalo construido se denomina nivel de confianza, y se denota . La
probabilidad de equivocarnos se llama nivel de significancia y se simboliza .
Generalmente se construyen intervalos con confianza 9 (o significancia
. Menos frecuentes son los intervalos con o .
VIDEOS







Intervalo de
confianza para la
media
Intervalo de confianza
para la diferencia de
medias
Intervalo de
confianza para la
proporcin
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

80


Leccin 12. Intervalos de confianza para medias y diferencias de
medias con muestras pequeas
30 n


La inferencia de la distribucin muestral de la media en muestras grandes es una
curva normal. Con mucha frecuencia la varianza se desconoce
2
en los
problemas de la vida real. Cuando se desconoce la varianza el estadgrafo z ya no
puede utilizarse para obtener intervalo de confianza. Parece lgico desarrollar
procedimientos en los cuales se utilice
2
S en lugar de
2
, de esta manera en lugar
del estadgrafo z utilizaremos el para deducir inferencias acerca de la media. Si
la media de la poblacin es la distribucin muestral de
1 - n
t es una distribucin t,
teniendo en cuenta que las observaciones, x
1,
x
2,
x
3,
x
n
son elegidas
aleatoriamente y extradas de una poblacin normal.
Entonces, queda claro que cuando las muestras son pequeas la distribucin
muestral es la distribucin t. Esta se caracteriza porque es ms puntual que la
distribucin normal, reuniendo mayor proporcin de casos en los extremos de la
curva a diferencia de la distribucin normal.
La distribucin t a medida que el tamao de la muestra "n" aumenta, tal
distribucin t se va pareciendo ms a la normal, de tal modo que cuando n > 30
no existen diferencias entre la distribucin normal y la distribucin t. Entonces,
cuando n < 30 existe una curva diferente para cada valor de "n".

Grados de libertad.
Nmeros de elementos en una muestra que pueden variar despus de haber
seleccionado cierto nmero de ellas. Supngase que existen dos elementos en
una muestra y se conoce la media. Se tiene libertad para especificar slo uno de
los dos valores, ya que el otro queda determinado automticamente; queda claro
que el total de los dos valores es dos veces la media.

Ejemplo

Si la media es de $ 6 pesos es posible elegir slo un valor. Si se elige $ 4 pesos el
otro valor es $ 8, ya que $ 4 + $ 8 = 12 /2 = $ 6. As que hay un grado de libertad
en este ejemplo. Se podra haber determinado mediante n - 1 = 2 - 1 = 1 grados
de libertad. Si n=4, entonces hay 3 grados de libertad, lo que se obtiene mediante
n - 1 = 4 1 = 3.
1 n
t

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

81


En general, para la distribucin t de Student, se puede decir que el nmero de
grados de libertad es igual al tamao de la muestra o nmero de datos menos
uno, es decir: g.l =

12. Pasos para la construccin de un Intervalo de confianza para la media
, muestras pequeas.

1. Determinar el nivel de confianza al que vamos a trabajar.

2. Obtener los grados de libertad g L = n 1

3. Calcular el valor t correspondiente al nivel de confianza fijado con
grados de libertad y con ayuda de la tabla del anexo.

4. La tabla

se divide en 10 columnas. La primera indica los grados de
libertad, y las siguientes columnas corresponden a los niveles de
significanca que son 0.5, 0.4, 0.2, 0.1, 0.05, 0.025, 0.010, 0.005 y
0.001

5. De esta manera para un valor t correspondiente a un nivel de
significanca del 10% y 18 grados de libertad hay que buscar la
interseccin de la columna del 10% y la fila donde aparezca 18 (grados)
g 1, obteniendo un valor de t = 1.734


6. Calcular el error tpico de la media y determinar el error muestral

7. Determinar el intervalo de confianza para la media de la poblacin,
sumando y restando a la media de la muestra ( x ) el error muestral as:
|
.
|

\
|

n
S
t X

Ecuacin No.27
1 n
t

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

82


con n 1 grados de libertad y el valor de t depende del nivel de confianza.

Ejemplo Intervalo de confianza para pequeas muestras
Una muestra de 10 cajas de atn dio un peso neto medio de 184 gramos y una
desviacin estndar de 3.0 gramos. Encontrar los lmites de confianza con un 95%
para el verdadero peso promedio de todas las latas de atn.
La siguiente grafica nos ayuda a comprender la presente situacin:

Grfico No.10 Distribucin t-student con 9 grados de libertad

En la tabla de la distribucin t con 9 grados de libertad y un nivel de significancia
del 5% para dos colas, se registra un valor de 2.69 como valor crtico. (Recuerde
que es a dos colas.
El intervalo de confianza para la media de peso de todas las cajas de atn est
dado por:
(

) 6 (

) 6 ( 6)
Se interpreta que las cajas de atn tienen un promedio de peso entre 181.85 y
186.14 gramos con un nivel de confianza del 95% y expresado matemticamente
es: ( 6) 9

0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
P
r
o
b
a
b
i
l
i
d
a
d

Valor estadstico t
Distribucin T-student con V grados de libertad
o/2= 0,025
1 o = 0,95
o/2= 0,025
1 o = 0,95
-2,69 +2,69
Grados de
Libertad n-1 =
10 - 1= 9
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

83


La tabla t-student que se usa en este mdulo es a dos colas, por
tanto deben ubicarse en la columna directamente del nivel de
significancia que se est aplicando, es decir, si el alfa es de 5% se
ubica en la columna del 0,05 y busca los grados de libertad
correspondiente.
Clic ac para descargar tablas
12.1. Intervalos diferencias de medias, varianzas desconocidas pero
iguales ( = = )
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba
estadstica para verificar si stas son iguales o diferentes. Para realizarlo debemos
hacer uso de la distribucin F, bien sea mediante el clculo de la probabilidad de
que la muestra tomada provenga de dos poblaciones con varianzas iguales, o
mediante el uso de un intervalo de confianza para la relacin de dos varianzas,
segn se estudiar ms adelante.

Grfico No.11 Intervalos de confianza para diferencia de medias

INTERVALO PARA LA
DIFERENCIA DE MEDIAS


(varianza desconocida

)
Verificar si las varianzas son iguales usando la prueba F
F


SI.
Aplicar la frmula:


El limite inferior se obtiene restandole a la diferencia
de medias muestrales

lo que da la frmula y
el limite superior sumando.
NO.
Usar frmula de intervalo
para la diferencia de medias
pero con varianzas
desiguales

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

84


Primera fase: Probar varianzas iguales

Grfico No.12 Distribucin F. Prueba varianzas iguales

Ejemplo Prueba para determinar si las varianzas son iguales.

Para encontrar si un nuevo suero detiene la leucemia, se seleccionan nueve
ratones, todos con una etapa avanzada de la enfermedad. Cinco ratones reciben
el tratamiento y cuatro no. Los tiempos de sobrevivencia en aos, a partir del
momento en que comienza el experimento son los siguientes:

Con Tratamiento 2.1 5.3 1.4 4.6 0.9
Sin Tratamiento 1.9 0.5 2.8 3.1
Con un nivel de significancia del 0.05 pruebe que las varianzas son iguales.
Datos:
Con tratamiento Sin tratamiento

s= 1.97 s = 1.1672
n = 5 n = 4
Estadstico de prueba: F


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

85


La sugerencia que se hace es que el numerador sea el de valor mayor . En este
caso la desviacin ms grande corresponde a la muestra con tratamiento.
Entonces los grados de libertad se calculan restndole 1 al tamao de la muestra;
ya que con tratamiento se ubica en el numerador, los grados de libertad de dicho
numerador son 4.
GL
1
= 5-1 = 4 y GL
2
= 4-1=3.

Grfico No.13 Prueba de varianzas iguales. Tratamiento de leucemia

Regla de decisin:
Si 0.10 F
c
15.1 no hay evidencia para decir que las varianzas NO son iguales,
Si la F
c
< 0.10 si F
c
> 15.1 las varianzas No son iguales.
Clculo:
F


Decisin y Justificacin:
Como 2.85 esta entre los dos valores de H
o
no se rechaza , y se concluye con
un o = 0.05 que existe suficiente evidencia para decir que las varianza de las
poblaciones son iguales.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

86



Si mediante el uso de la distribucin F se llega a la conclusin de que las
varianzas son iguales, el procedimiento a seguir para el clculo del intervalo de
confianza para la diferencia de dos medias ser el siguiente:

Pasos despus de verificar que las varianzas son iguales:
a) El estadstico usado como estimador puntual de la diferencia de medias 1 - 2
ser T, que es un estimador suficiente.
b) La variable aleatoria asociada con el estimador ser la variable T definida como:

Ecuacin No.28

Donde

es un estimador combinado de

, mejor que

por separado, y


Ecuacin No.29
c) Para calcular el intervalo de confianza se debe tener en cuenta la siguiente
probabilidad:


Ecuacin No.30
De nuevo, manipulando la expresin anterior en forma similar a los casos se llega
al siguiente teorema que nos define el intervalo de confianza para la diferencia
entre dos medias 1 - 2 con varianzas desconocidas

, pero iguales:
Segunda fase: intervalo de confianza


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

87


Teorema. Si

son las medias y las varianzas de dos muestras


aleatorias de tamaos n1 y n2, respectivamente, tomadas de dos poblaciones
normales e independientes con varianzas desconocidas pero iguales, entonces un
intervalo de confianza del 100(1-)% para la diferencia entre medias 1 - 2 es:


Ecuacin No.31

Si el intervalo de confianza que se construye contiene al cero (0) no
existe diferencia significativa entre las medias .


Ejemplo Intervalo de confianza para pequeas muestras
La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el
contenido de nicotina de dos marcas de cigarrillos.
Marca A Marca B

10 8

3,1 2,7

0,5 0,7
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de
poblaciones normales con varianzas desconocidas, construya un intervalo de
confianza del 95% para la diferencia real de nicotina de las dos marcas.


Inicialmente mediante la distribucin F debemos verificar si las varianzas son
iguales
( = = )


Primera fase: Probar varianzas iguales
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

88


Buscando en la tabla de la distribucin F para 7 grados de libertad en el
numerador y 9 en el denominador, vemos que los dos valores que acotan la zona
de aceptacin son 0.207 y 4,197, entonces el F calculado 1,96 cae en la zona de
aceptacin . Se concluye que no hay evidencia para rechazar la hiptesis de que
las varianzas sean iguales.

Como las varianzas son iguales, calculamos que est dado por:


El intervalo de confianza del 95% est dado por (t0.025,16 = 2.12):



Debido a que la diferencia real puede ser nula, ya que el intervalo construido
contiene al cero, no se puede concluir que existe una diferencia en el contenido de
nicotina de las dos marcas de cigarrillos.
Ejercicio propuesto
El gerente de una refinera piensa modificar el proceso para producir gasolina a
partir de petrleo crudo. El gerente har la modificacin slo si la gasolina
promedio que se obtiene por este nuevo proceso (expresada como un porcentaje
del crudo) aumenta su valor con respecto al proceso en uso. Con base en
experimentos de laboratorio y mediante el empleo de dos muestras aleatorias de
tamao 12, una para cada proceso, la cantidad de gasolina promedio del proceso
en uso es de 24.6 con una desviacin estndar de 2.3, y para el proceso
propuesto fue de 28.2 con una desviacin estndar de 2.7. El gerente piensa que
los resultados proporcionados por los dos procesos son variables aleatorias
independientes normalmente distribuidas con varianzas iguales. Con base en esta
evidencia, debe adoptarse el nuevo proceso?

Segunda fase: intervalo de confianza
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

89


12.2. Intervalos para diferencias de medias y varianzas desconocidas y
desiguales


Si mediante el uso de la distribucin F se llega a la conclusin de que las
varianzas son diferentes, el procedimiento a seguir para el clculo del intervalo de
confianza para la diferencia de dos medias ser el siguiente:

a) El estadstico usado como estimador puntual de la diferencia de medias 1 - 2
ser

, que es un estimador suficiente


b) La variable aleatoria asociada con el estimador ser la variable T definida como:

Estadstico de prueba para la diferencia de medias con varianzas desiguales

V: grados de libertad
Donde V es:


c) El intervalo de confianza est dado por el siguiente teorema, basado en la
distribucin t con n grados de libertad.
Teorema. Si

son las medias y las varianzas de dos muestras


aleatorias de tamaos n1 y n2, respectivamente, tomadas de dos poblaciones
normales e independientes con varianzas desconocidas y desiguales, entonces un
intervalo de confianza aproximado del 100( )% para la diferencia entre medias
1 - 2 es:



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

90



Ecuacin No.32

Ejemplo
Un fabricante de monitores prueba dos diseos de microcircuitos para determinar si
producen un flujo de corriente equivalente. El departamento de ingeniera ha obtenido los
datos siguientes:

Diseo 1 n
1
= 16

s
1
2
= 10
Diseo 2 n
2
= 10

s
2
2
= 40
Con = 0.05, se desea determinar si existe alguna diferencia significativa en el flujo
de corriente promedio entre los dos diseos, donde se supone que las dos
poblaciones son normales, pero no es posible suponer que las varianzas
desconocidas sean iguales.Tomado de la web del Instituto Tecnolgico de
Chihuaha, Mxico)

Estadstico de prueba:
F


La sugerencia que se hace es que el numerador sea el de valor mayor . En este
caso la desviacin ms grande corresponde a la muestra Diseo 2.
Entonces los grados de libertad GL
1
= 10-1 = 9 y GL
2
= 16-1=15.


Primera fase: Probar varianzas iguales
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

91



Grfico No.14 Prueba de varianzas iguales. Diseo de microcircuitos
Decisin y Justificacin:
Como 4 es mayor que 3.12, esta en la zona de rechazo, se concluye con un o =
0.05 no existe suficiente evidencia para decir que las varianza de las poblaciones
son iguales, por tanto se suponen varianzas diferentes.


Para poder buscar el valor de t en la tabla, se necesita saber el valor de los grados
de libertad:

[
(


] [
(


]


Este valor se redondea al prximo menor que sera 11. Entonces los grados de
libertad son 11.

Segunda fase: intervalo de confianza
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

92


Ver la tabla t-student en los Contenidos del curso, Anexo: Tablas estadsticas.
Recuerde que si el nivel de significancia es 0,05 debe ubicarse directamente en la
columna 0,05 con 11 grados de libertad, ya que siempre un intervalo de confianza
supone una distribucin a dos colas y el Excel por defecto supone distribucin a
dos colas con la funcin =DISTR.T.INV, por tanto, no es necesario dividir el alfa en
dos.
En el caso de las pruebas de hiptesis se pueden dar pruebas a una o dos colas,
por ello cuando se utilice la tabla t-student del anexo si la prueba tiene un alfa de
0,05 y es a una cola, usted deber ubicar la columna 0,10 ( es decir multiplica por
dos el alfa antes de ver en la tabla).
Estadstico de prueba
Se aplica el estadstico de prueba para la diferencia de medias con varianzas desiguales:

()

.

Y se compara con los valores encontrados en la tabla t-student con 11 grados de
libertad y un o = 0.05

Grfico No.15 Intervalos de confianza. Diseo de microcircuitos
Justificacin y decisin:
Como 0.1395 esta entre 2.201 y 2.201, no se rechaza la hiptesis de que las
diferencia de medias es cero. Se concluye con un o= 0.05, que no existe
diferencia significativa en el flujo de corriente promedio entre los dos diseos.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

93


El intervalo de confianza aplicando la ecuacin No.32 es:
(. . )

(. . )


Al realizar los clculos se tiene que el intervalo de confianza para la diferencia de
las medias del flujo corrientede los diseos es (-4,43; 5,033) el cual contiene al
nmero cero, por tanto no hay evidencia de diferencias entre los diseos, es decir
que producen un flujo de corriente equivalente y por tanto es indiferente el diseo
que seleccione el fabricante de monitores para los microcircuitos.

En el ejemplo anterior si en el intervalo no estuviera el cero, por ejemplo un
intervalo (0.12 ; 3) se concluira que la diferencia entre los amperajes
promedios esta entre 0.12 y 3; adems que el diseo 2 produce un flujo
promedio de corriente mayor, por lo cual el fabricante de monitores escogera
dicho diseo.

Ejercicio propuesto
Cierto metal se produce, por lo comn, mediante un proceso estndar. Se
desarrolla un nuevo proceso en el que se aade una aleacin a la produccin del
metal. Los fabricantes se encuentran interesados en estimar la verdadera
diferencia entre las tensiones de ruptura de los metales producidos por los dos
procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de stos se
somete a una tensin hasta que se rompe. La siguiente tabla muestra las
tensiones de ruptura de los ejemplares, en kilogramos por centmetro cuadrado:

Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e
independientes, obtener los intervalos de confianza estimados del 95 y 99% para
la diferencia entre los dos procesos. Interprete los resultados


En el caso de que el intervalo no contenga al cero, se rechaza la
hiptesis de que las medias son iguales, por tanto al ser diferentes se
asume que

es mayor que


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

94


12.3. Intervalos unilaterales para diferencias de medias y varianzas
desconocidas e iguales


En algunas situaciones prcticas, no es necesario encontrar tanto el limite inferior
como el limite superior para el parmetro de inters, sino solo uno de ellos. Por
esta razn, ahora se contruirn intervalos unilaterales para la diferencia de medias

cuando las varianzas son desconocidas pero iguales.


Ejemplo
Usar los datos del ejemplo del fabricante de monitores que prueba dos diseos de
microcircuitos para determinar si producen un flujo de corriente equivalente, pero en este
caso construir un intervalo unilateral para diferencia de medias con varianzas
desconocidas pero iguales

Poblacin1 Poblacin2
Tamao de la muestra = 16 10
Cuasi varianza = 10 40
Media muestral = 24,2 23,9
Nivel de confianza = 0,95

Caso de varianzas poblacionales desconocidas pero iguales

Intervalo bilateral Intervalos unilaterales
to = 2,063898562 to = 1,71088208
Radio del intervalo = 3,835257238 Radio = 3,179261327
Lmite infer.= -3,535257238 Cota inferior = -2,879261327
Lmite super.= 4,135257238 Cota superior = 3,479261327
El procedimiento en el caso unilateral es idntico al bilateral, en primer lugar se
prueba si las varianzas son iguales y luego se procede a calcular el intervalo de
confianza; pero en el caso unilateral cuando se calcula el estadstico terico (
tabulado) se debe multiplicar por dos (2) el nivel de confianz alfa (o); en excel se
obtiene con la funcin =DISTR.T.INV(2*(1-o);n1+n2-2)
Los valores de la table se obtienen as:
- Estadstico tabulado
to =DISTR.T.INV(2*(1-0,95);16+10-2)
- Radio
Recordar:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

95


- Cota inferior y superior



12.4. Intervalos unilaterales para diferencias de medias y varianzas
desconocidas y desiguales


Ejemplo
Usar los datos del ejemplo del fabricante de monitores que prueba dos diseos de
microcircuitos para determinar si producen un flujo de corriente equivalente, pero en este
caso construir un intervalo unilateral para diferencia de medias con varianzas
desconocidad pero desiguales.
Caso de varianzas poblacionales desconocidas y desiguales

Intervalo bilateral Intervalos unilaterales
Cuasivarianza1/Cuasivarianza2= 0,25
Grados de libertad= 11
to = 2,20098516 to = 1,795884819
Radio del intervalo = 4,733397564 Radio = 3,862196338
Lmite infer.= -4,433397564 Cota inferior = -3,562196338
Lmite super.= 5,033397564 Cota superior = 4,162196338
Los valores de la table se obtienen as:
- Estadstico tabulado
to =DISTR.T.INV(2*(1-0,95);GL)
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

96


- Radio

()


- Cota inferior y superior




12.5. Intervalos de confianzas para diferencias entre dos medias con
muestras relacionadas o dependientes.
Cuando se comparan las medias de dos niveles es deseable que las
observaciones dentro de cada nivel sean lo ms homogneas posibles. Si existe
un efecto debido a factores externos stos pueden neutralizarse mediante la
aplicacin del principio de la aleatoriedad. Esto se logra tomando las
observaciones en pares. Se supone que las condiciones exteriores son las
mismas para cada par, pero pueden variar de un par a otro. Por ejemplo, suponga
que se tiene un grupo de personas que se someten a una dieta para reduccin de
peso, y para cada persona se lleva el registro del peso, en kgs, antes de la dieta, y
un tiempo razonable despus de haber empezado la dieta. En este caso, el peso
de cada persona despus de la dieta no es independiente del peso de la misma
persona antes de la dieta; por lo tanto estas dos variables estn correlacionadas, y
si se quiere examinar el efecto de la dieta, se debe llevar el registro del peso para
la misma persona antes y despus de la dieta.

Sean (X11, X21), (X12, X22),..., (X1n, X2n) los datos consistentes de n pares;
supondremos que las variables aleatorias X1 y X2 tienen medias 1 y 2, y
varianzas

, respectivamente. Podemos suponer que el conjunto de datos


apareados son observaciones de un conjunto independiente de parejas de
variables aleatorias provenientes de una distribucin normal bivariada
(X1 X2) ~ f(X1, X2), y que las diferencias D = X1 - X2 se distribuyen normalmente
con valor esperado ED y varianza

.
Sea Dj la diferencia entre las variables aleatorias del j-simo par, es decir, Dj =
X1j-X2j. El valor esperado y la varianza de la diferencia entre las variables est
dado por:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

97




Si las variables X1 y X2 se distribuyen normalmente, las diferencias estarn
distribuidas tambin de manera normal con media

y varianza



Para estimar la media y la varianza de la diferencia, se debe tomar una muestra
aleatoria de tamao n, antes y despus, calcular la diferencia, y luego la diferencia
promedio y la varianza muestral de las diferencias, como se ilustra en el siguiente
cuadro.

Dada la muestra aleatoria se calculan los siguientes estadsticos que servirn para
estimar la media y la varianza de la diferencia,

, respectivamente:


Sabemos que la siguiente variable aleatoria sigue una distribucin normal
estndar:


Sin embargo, como

, no es conocido, lo podemos estimar mediante la varianza


muestral

, en cuyo caso la siguiente variable aleatoria sigue una distribucin t


con n-1 grados de libertad.
Usando la distribucin t podemos calcular el intervalo de confianza para la media
de observaciones pareadas, el cual est dado por el siguiente teorema.
Teorema. Si

son la media y la desviacin estndar mustrales de la


diferencia de n pares aleatorios de mediciones normalmente distribuidas, entonces
un intervalo de confianza del ( )para la diferencia de medias
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

98

Es:


Ecuacin No.33
Ejemplo Intervalo de confianza diferencia de medias para pequeas muestras

Se est investigando la utilidad de dos lenguajes de diseo para mejorar las tareas
de programacin. Se le ha pedido a 12 programadores expertos, familiarizados
con los dos lenguajes, que codifiquen una funcin estndar con ambos lenguajes,
y se registra el tiempo requerido, en minutos, para realizar estas dos tareas. Los
datos obtenidos son los siguientes:

Encuentre un intervalo de confianza para la diferencia en los tiempos medios de
codificacin. Use un nivel de confianza del 95%. Existe alguna evidencia que
indique una preferencia por alguno de los dos lenguajes?

Tenemos que:

El intervalo de confianza est dado por:



UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

99


Dado que la diferencia puede ser cero, se concluye que no hay evidencia para
rechazar la hiptesis de que ambos lenguajes requieren el mismo tiempo de
programacin, y por lo tanto no hay preferencia por ninguno de los dos lenguajes.

Leccin 13. Intervalos de confianza para la media y diferencias de
medias muestras grandes 30 > n

13. Recordemos que para obtener un intervalo de confianza se procede
como sigue:
1. Se determina el riesgo de error que se quiere asumir al afirmar que el
parmetro (en este caso la media) se encuentra en el interior del
intervalo.
2. El intervalo de confianza se obtiene separando a izquierda y derecha
de la estimacin del parmetro (en este caso la media) un mltiplo de
error estndar ( )
n
o
. El mltiplo est determinado por el valor del
estadstico Z asociado al nivel de confianza escogido.

13.1. Para la construccin del intervalo de confianza para la media
poblacional , se han fijado los siguientes pasos:
1. Fijar el nivel de confianza - 1

2. Calcular la estandarizacin z de acuerdo al nivel de confianza
predeterminado a travs de la tabla de la distribucin normal N (0,1)

3. Calcular la media x y desviacin tpica S de la muestra.

4. Calcular el error tpico de la media (desviacin tpica de la distribucin
muestral)

5. Calcular el error muestral

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

100


6. Construir el intervalo de confianza, sumando y restando a la media de la
muestra ( x ) el error muestral.



Ecuacin No.34
Ejemplo

Suponga por ejemplo que Ud. est dispuesto a aceptar un riesgo de error de
05 . 0 = o ; entonces 95 . 0 1 = o , luego se trata de un intervalo de confianza del
nivel 0.95. Dado que esta probabilidad se distribuye simtricamente a los dos
lados de la media, se obtiene 0.475 a cada lado. Ahora bien, el valor de Z
asociado a una probabilidad de 0.475 es de 1.96 (de acuerdo a la tabla de la
distribucin normal) a la derecha de la media y de 1.96 a la izquierda, como se
puede apreciar en la siguiente grfica:
Intervalo de confianza para grandes muestras

Grfico No.16 Intervalo de confianza para muestras grandes

El intervalo de confianza est dado por la siguiente relacin:
(

|
.
|

\
|
+ |
.
|

\
|

n
X
n
X
o o
96 . 1 ; 96 . 1

Expresado en forma generalizada, para poblaciones infinitas o si se muestrea sin

)
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

101


reemplazamiento una poblacin finita, la relacin es:
|
.
|

\
|

n
X
o
96 . 1

Si la poblacin es finita o si se muestrea sin reemplazamiento una poblacin finita,
la relacin es la siguiente:
|
|
.
|

\
|

|
.
|

\
|

1 N
n N
n
Z X
o

Ecuacin No.35
Recuerde que Z depende del nivel de confianza que se fije y que si la desviacin
estndar poblacional ( ) o es desconocida, se utiliza como estima la desviacin
muestral (S).
Podr darse cuenta las semejanzas con los procedimientos utilizados para las
pruebas de hiptesis, vistas anteriormente para pruebas unilaterales y bilaterales.
Ejemplo

El contenido de protenas de una muestra de 100 pollos criados en una
determinada granja dio una media de 20.2 gramos con una desviacin estndar
de 1.14 gramos. Obtener el intervalo de confianza del 99% para el contenido
medio de protena de todos los pollos de la granja.
Como el intervalo de confianza se distribuye simtricamente a los dos lados de la
media, en este caso a cada lado le corresponde una probabilidad de 0.495 (0.99/2
= 0.495). El valor de Z asociado a una probabilidad de 0.795 es 2.58.
El intervalo para la media ser:
294 . 0 2 . 20
100
14 . 1
58 . 2 2 . 20 |
.
|

\
|
|
.
|

\
|

n
Z X
o

El contenido medio de protena de toda la poblacin de pollos de la granja est
dentro de un intervalo de 19.91 y 20.49 gramos con un nivel de confianza del 99%,
y se expresa de la siguiente forma:
{ } 99 . 0 49 . 20 91 . 19 > P

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

102


Ejemplo

Se toma una muestra al azar de 40 vasos de kumis de un lote de 500, dieron un
promedio de 76 caloras por cada 100 gramos con una desviacin estndar 2.9
caloras. Obtener el intervalo de confianza del 95% para el contenido medio de
caloras para todo el lote.
Ntese que se trata de una poblacin finita y muestreo sin reemplazamiento. El
valor de Z asociado a un nivel de confianza del 95% es 1.96 (0.95/2 = 0.475) de
acuerdo a la tabla de la distribucin normal.
El intervalo de confianza en este caso est dado por:
87 . 0 76
499
40 500
40
9 . 2
76
1

|
|
.
|

\
|

|
.
|

\
|

|
|
.
|

\
|

|
.
|

\
|

N
n N
n
Z X
o

Por tanto el contenido medio de caloras del lote esta dentro del intervalo de 75.13
y 76.87 caloras con un 95% de nivel de confianza, y expresado matemticamente
es:
{ } 95 . 0 87 . 76 13 . 75 > P


13.2. Intervalo de confianza para la diferencia entre dos medias.
El intervalo de confianza para la diferencia de medias de poblaciones infinitas est
dado por:
2
2
2
1
2
1
2 1
n n
Z X X
o o
+

Ecuacin No.36

Se analiz el contenido de vitamina A de una muestra de mantequilla y de una
muestra de margarina enriquecida. En la muestra de mantequilla formada por 40
potes de 100 gramos, el contenido medio de vitamina A fue de 4.86 unidades con
una desviacin estndar de 0.06. En la muestra de margarina enriquecida formada
por 50 potes de 100 gramos el contenido medio de vitamina A fue de 5.0 unidades
con una desviacin estndar de 0.08 unidades. Encontrar el intervalo de confianza
del 95% para la diferencia de contenido medio de vitamina A para el experimento
en mencin.
Generalmente el mayor valor de la media se toma como
1
X .
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

103


El nivel de confianza del 95% corresponde un Z = 1.96.
Aplicando la frmula se tiene:
029 . 0 14 . 0 00009 . 0 000128 . 0 96 . 1 14 . 0
40
06 . 0
50
08 . 0
96 . 1 86 . 4 0 . 5
2 2
2
2
2
1
2
1
2 1
+
+ +
n n
Z X X
o o

Por lo tanto se puede afirmar con un nivel del 95% que la diferencia de los dos
contenidos de vitamina A de la mantequilla y la margarina enriquecida se
encuentran entre 0.111 y 0.169 unidades.

Leccin 14. Intervalos de confianza para la proporcin y
diferencias de proporciones (siempre son muestras grandes)
30 > n

14. Las proporciones.
Siempre que se trabaje con proporciones la muestra debe ser grande.
14.1. Intervalo de confianza para proporciones.
Recuerde las propiedades de la distribucin binomial y de las pruebas de hiptesis
vistan anteriormente.
El intervalo de confianza para la proporcin de la poblacin infinita y muestreo con
reemplazamiento est dada por:
n
PQ
Z P

Ecuacin No.37
En tanto que el intervalo de confianza para la proporcin de la poblacin finita y
muestreo con reemplazamiento est dada por:
1

N
n N
n
PQ
Z P

Ecuacin No.38
Donde el valor de Z depende del nivel de confianza deseado.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

104


Ejemplo

De un lote de 500 frascos de jugo se extrae una muestra de 50 frascos de los
cuales 43 cumplen con las especificaciones exigidas y 7 fueron rechazados. Hallar
el intervalo de confianza del 95% para la proporcin de frascos de jugo aceptados
del lote de estudio.
Para un nivel de confianza de 95% el valor de Z = 1.96 (tabla de distribucin
normal)
Aplicando la frmula se tiene:
( )( )
( )( ) 09 . 0 86 . 0 95 . 0 049 . 0 96 . 1 86 . 0
499
450
50
) 14 . 0 )( 86 . 0 (
96 . 1 86 . 0
1 500
50 500
50
50
43
1
50
43
96 . 1
50
43
1

N
n N
n
PQ
Z P

Con un nivel de confianza del 95% la proporcin de frascos aceptados fue de 0.77
y 0.95, es decir el nivel de aceptacin est entre 380 y 480 frascos de lujo de un
lote de 500 frascos

14.2. Intervalo de confianza para la diferencia de dos proporciones.
El intervalo de confianza para la diferencia de proporciones de poblaciones
infinitas est dado por:
2
2 2
1
1 1
2 1
n
q p
n
q p
Z P P +

Ecuacin No.39

En un supermercado se vende queso de dos marcas diferentes. En el mismo
perodo de tiempo se vende 380 de un total de 500 unidades de la marca A y 333
de un total de 450 unidades de la marca B. Hallar el intervalo de confianza del
99% para la diferencia entre las proporciones de los quesos A y B que salen al
mercado y se venden.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

105


Aplicando la frmula de la diferencia de proporciones se tiene:
073 . 0 02 . 0
450
) 26 . 0 )( 74 . 0 (
500
24 . 0 )( 76 . 0 (
58 . 2 74 . 0 76 . 0
450
450
117
450
333
500
500
120
500
380
58 . 2
450
333
500
380
2
2 2
1
1 1
2 1
+
|
.
|

\
|
|
.
|

\
|
+
|
.
|

\
|
|
.
|

\
|
+
n
q p
n
q p
Z P P

Por lo cual es de esperar con un nivel de confianza del 99% que la verdadera
diferencia de proporcin de venta de los quesos A y B se encuentre entre 0.053 y
0.093. La diferencia de proporcin negativa del lmite inferior del intervalo indica
que en esta regin la diferencia est a favor del queso B cuya proporcin de venta
es menor en las muestras estudiadas.

Leccin 15. Intervalos de confianza para la varianza poblacional.

Para ver cmo se aplica un intervalo de confianza para la varianza poblacional,
suponga que se est interesado en estimar la varianza poblacional para el
mecanismo de llenado de tal modo que la media de la cantidad de llenado sea de
16 onzas y es crtica la varianza de los llenados. Para el efecto se toma una
muestra de 20 envases llenos y se encuentra que la varianza de las cantidades de
llenado es 0025 . 0
2
= s Sin embargo, no se puede esperar que esa varianza que
procede de una muestra de 20 envases, proporcione el valor exacto de la varianza
de la poblacin de recipientes llenos con dicho producto. En consecuencia el
inters est es determinar un estimado de intervalo de la varianza poblacional.
Se utiliza el smbolo
2
o
_ para representar el valor de la distribucin ji cuadrado que
da como resultado un rea, o probabilidad, de o a la derecha del valor ji cuadrado
establecido. Por ejemplo en la siguiente figura, se observa la distribucin ji
cuadrado con 8523 , 32
2
025 . 0
= _ que indica que el 2.5% de los valores de ji cuadrado
est a la derecha de 32,8523, y 90655 , 8
2
975 . 0
= _ que indica que el 97.8% de los
valores de ji cuadrado est a la derecha de 8,90655. Consultan con la tabla del
anexo G que hace relacin a la tabla de distribucin de ji cuadrado, los
resultados son iguales.
En la grfica se puede observar que 0.95 o el 95% de los valores de la ji cuadrada
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

106


estn entre
2
975 . 0
_ y
2
025 . 0
_ . Significa esto que existe una probabilidad del 95% de
obtener un valor de
2
_ tal que:
( )
2
025 . 0
2
2
2
975 . 0
1
_
o
_ s

s
S n


Esta ecuacin define un estimado de intervalo, porque el 95% de todos los valores
posibles de
( )
2
2
1
o
S n
se encuentran en el intervalo de
2
975 , 0
_ a
2
025 . 0
_ .

Grfico No.17 Intervalo de confianza. Mecnismo de llenado.

Ahora se requiere llevar a cabo algunas operaciones algebraicas de la ecuacin,
para determinar un estimado de intervalo de
2
o de la varianza poblacional.
Realizando operaciones del extremo izquierdo de la ecuacin se tiene:
( )
2
2
2
975 . 0
1
o
_
S n
s
despejando la varianza se tiene:
( )
2
975 . 0
2
2
1
_
o
S n
=


realizando operaciones semejantes con la desigualdad del extremo derecho de la
ecuacin se tiene:
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0
,
0
0
1 2 4 6 8
1
0
1
2
1
4
1
6
1
8
2
0
2
2
2
4
2
6
2
8
3
0
3
2
3
4
3
6
3
8
Distribucin Chi-Cuadrado. Funcin de Densidad Probabilidad
con 19 grados de libertad
1 o = 0,95
o/2 =0,025
o/2= 0,025
_
2
(0,975) =8,90
_
2
(0,025) =32,85
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

107


( )
2
2
025 . 0
2
1
o
_
s
S n
despejando la varianza se tiene:
( )
2
025 . 0
2
2
1
_
o
S n
>

Por ltimo combinando los resultados de las operaciones se llega a:
( ) ( )
2
975 . 0
2
2
2
025 . 0
2
1 1
_
o
_
S n S n
s s


Esta relacin representa el estimado del intervalo de confianza para la varianza
2
o .
Ejemplo

Regresando al problema para determinar un estimado de intervalo de la varianza
poblacional de las cantidades de llenado, recuerde que la muestra es de 20
envases que presenta una varianza de 0025 . 0
2
= S . Con un tamao de muestra de
20, los grados de libertad son de 19. En la figura presentada anteriormente, se
determina que 90655 , 8
2
975 . 0
= _ y 8523 , 32
2
025 . 0
= _ . Con dichos valores,
reemplazando en la ecuacin del intervalo para la varianza poblacional se tiene:
( )( ) ( )( )
90655 , 8
0025 . 0 1 20
8523 , 32
0025 . 0 1 20
2

s s

o

O sea que el intervalo se encuentra dentro de los lmites: 0728 . 0 0374 . 0
2
s s o .
Con lo anterior se ha ilustrado el proceso de aplicar la distribucin ji cuadrado para
establecer estimados de intervalo de una varianza y de una desviacin estndar
de una poblacin. Especficamente observe que como se us
2
975 , 0
_ y
2
025 . 0
_ el
estimativo tiene un coeficiente de confianza de 0.95. Cuando la ecuacin se
ampla a un caso general de cualquier coeficiente de confianza, el estimativo del
intervalo de confianza es:
( ) ( )
( )
2
2
1
2
2
2
2
2
1 1
o o
_
o
_

s s
S n S n

Ecuacin No.40
En donde los valores de
2
_ se basan en una distribucin ji cuadrado con (n-1)
grados de libertad, y en donde ( ) o 1 es el coeficiente de confianza.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

108


EJERCICIOS COMPLEMENTARIOS
1. Una investigacin efectuada a 400 familias de clase medias, revel que un
62% de sus ingresos anuales son utilizados para servicios de salud.
Determinar los lmites de confianza del 99%

2. En una muestra de 14 observaciones que tienen una media de 34.86 y una
desviacin estndar de 4.23, encuentre los lmites que en el 95% de los casos
permiten acertar al afirmar que la media poblacional queda incluida entre ellos.

3. Un laboratorio qumico desea estimar la reaccin promedio de mercurio
utilizadas en un medicamento. Qu tamao de muestra se requiere para
garantizar que habr un riesgo de solo 0.001 de sobrepasar un error de 5mm o
ms en la estimacin? La desviacin estndar de la reaccin se estima en
50mm

4. Un sondeo efectuado a 400 familias de clase media revel un gasto trimestral
promedio de $ 374.000 en productos de salud, con desviacin de $80.000.
a) Determine un intervalo de confianza del 95%
b) Cul es el mximo error, cuando se afirma que dicha media es de $374.000 con
una confianza del 99%?











UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

109



REFERENTES

Cmo crear un grfico Chi-cuadrado en Excel (S, F). Extrado el 01 de Octubre de
2012 de: http://www.youtube.com/watch?v=eDCZhK7jeYg

Jurez, F., Villatoro, J. A. y Lpez, E. K. (2002). Apuntes de Estadstica Inferencial.
Mxico, D. F.: Instituto Nacional de Psiquiatra Ramn de la Fuente. Extrado el 10
de enero de 2012 de: http://rincondepaco.com.mx/Apuntes/Inferencial.pdf.

M. J. Navas, A (2001). Mtodos, diseos y tcnicas de investigacin psicolgica,
p.19. Madrid: Editorial: UNED. Extrado el 11 de octubre de 2012 de:
http://www.uv.es/mperea/T1.pdf

Mendoza, H, Bautista, G. (2002). Probabilidad y Estadstica. Universidad Nacional
de Colombia, http://www.virtual.unal.edu.co/cursos/ciencias/2001065/. Licencia:
Creative Commons BY-NC-ND.

Salinas, J. (s.f.). Estimacin por Intervalos. Extrado el 08 de Junio de 2012 de:
http://www.ugr.es/~jsalinas/apuntes/C12.pdf.

Ximnez, C. (s.f.). Tema 21: Distribucin muestral de un estadstico. Extrado el 20
de enero de 2012 de:
http://www.uam.es/personal_pdi/psicologia/carmenx/EsquemaTema21.pdf

CANAVOS, George. Estadstica y Probabilidad. Mc Graw Hill. Mexico 1.998
DEVORE, Jay. Probabilidad y estadstica. Quinta edicin. Thomsom-Learning.
Mxico 2.001
CHRISTENSEN, Howard B. (1999). Estadstica Paso a Paso. Mxico: Editorial
Trillas.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

110


HERNNDEZ MAHECHA, Carlo Marcelo (2002). Inferencia Estadstica. Gua de
Estudio. Santaf de Bogot: UNAD.
JONHSON, Richard. Probabilidad y Estadstica para Ingenieros. Printece mall
Mxico 1.997
MONTGOMERY, Douglas. Estadstica y Probabilidad. Segunda edicin. Limusa.
Mxico, 2.002
PEA, Daniel. Estadstica, Modelos y Mtodos. Vol. 1. Alianza Editorial. Madrid
1.988
ROSS, Sheldon. Probabilidad y Estadstica para Ingenieros. Segunda Edicin. Mc
Graw Hill. Mxico 2.001
SPIEGEL, Murria R. (1991). Estadstica. Serie de compendios Schaum. Mxico:
McGraw Hill
CASAS, J.M. (1997). Inferencia Estadstica. Centro de Estudios Ramn Areces,
Madrid.
SARABIA, J.M. (2000). Curso Prctico de Estadstica. Segunda Edicin. Civitas,
Madrid.
SARABIA, J.M. (2002). Apuntes de Inferencia Estadstica.
SARABIA, J.M., PASCUAL, M. (2002). Prcticas de Inferencia Estadstica.
CASAS, J.M., SANTOS, J. (1999). Estadstica Empresarial. Centro de Estudios
Ramn Areces, Madrid.
CUADRAS, C.M. (1983). Problemas de Probabilidades y Estadstica. Tomo II.
PPU, Barcelona.
MENDENHALL, W., REINMUTH, J.E. (1993). Estadstica para Administracin y
Economa. Grupo Editorial Iberoamericana, Mxico.
PEA, D. (2001). Fundamentos de Estadstica. Alianza Editorial, Madrid.
RUIZ-MAYA, L., MARTN PLIEGO, F.J. (2001). Estadstica II: Inferencia. Segunda
Edicin. AC, Madrid.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERIA
CONTENIDO DIDCTICO DEL CURSO: 100403 INFERENCIA ESTADISTICA

111


Sitios Web
http://ice.unizar.es/uzinnova/jornadas/pdf/95.pdf
http://www.fcnym.unlp.edu.ar/catedras/estadistica/programa2002.html#2
http://aprendeenlinea.udea.edu.co/lms/moodle/mod/resource/view.php?inpopup=tr
ue&id=3
http://aprendeenlinea.udea.edu.co/portal/
http://egkafati.bligoo.com/content/view/182409/Del_como_y_porque_ensenar_esta
distica.html
http://metro40.edv.uniovi.es/metroweb/charlas/Estadistica.pdf
http://www.uned.es/experto-metodos-avanzados/
http://aprendeenlinea.udea.edu.co/lms/moodle/course/view.php?id=322
http://server2.southlink.com.ar/vap/PROBABILIDAD.htm
http://es.wikipedia.org/wiki/Probabilidad
http://www.terra.es/personal2/jpb00000/pprobjunio99.htm
http://www.fvet.edu.uy/estadis/probabilidad.htm
http://thales.cica.es/rd/Recursos/rd98/Matematicas/28/matematicas-28.html
http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm
http://www.uantof.cl/facultades/csbasicas/Matematicas/academicos/emartinez/Esta
distica/index.html

También podría gustarte