P. 1
2 Distribución Normal y Muestreo

2 Distribución Normal y Muestreo

|Views: 339|Likes:
Publicado porkatherineÁ_49

More info:

Published by: katherineÁ_49 on Jan 11, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PPT, PDF, TXT or read online from Scribd
See more
See less

07/26/2013

pdf

text

original

DISTRIBUCION NORMAL

Muchas distribuciones de mediciones, que se hacen tanto en las ciencias
sociales como en las ciencias naturales, tienden a tener un polígono de
frecuencias con una forma que se asemeja al corte transversal de una
campana.

Esta distribución se observa mas cuando el numero de observaciones es
grande y cuando en muchos casos las investigaciones se realizan con
muestras de poblaciones grandes; en la mayoría de los casos las
distribuciones tienden a aproximarse a la curva en forma de campana.

Esto se denomina Distribución Normal, que por tener características
especiales se convierte en un requisito fundamental para entender el proceso
relacionado con la inferencia estadística y la prueba de hipótesis.
Distribución de los datos
Supongamos una muestra de 60 datos de una población de 2000 unidades
A partir de una tabla de frecuencias podemos elaborar un
histograma.
Si se aumenta el número de medidas, y
registra los valores en grupos con
columnas cada vez más estrechas, nos
acercaremos a la curva lisa. Esto es un
ejemplo de una curva de frecuencia, la
curva de distribución supuestamente
normal.
55 0
56 1
57 1
58 3
59 3
60 5
61 8
62 12
63 18
64 22
65 26
66 30
67 34
68 36
69 38
70 43
71 45
72 50
73 50
74 48
75 44
76 40
77 39
78 36
79 25
80 24
81 23
82 20
83 18
84 15
85 12
86 10
87 8
88 5
89 5
90 4
91 3
92 3
93 2
94 2
95 1
96 1
97 1
98 0
99 0
100 0
Construcción de un polígono de frecuencias con Minitab
Sobre la base de la distribución normal podemos calcular una dispersión
teórica de los resultados alrededor del valor medio, . Aproximadamente el
95 % de todos los resultados será localizado dentro del valor medio ± dos
veces la desviación estándar, y el 99.7 % de los resultados son localizados
dentro de ± tres veces la desviación estándar.
Dispersión teórica de los datos
Figura 7. Una distribución normal permite visualizar la probabilidad de que un resultado sea
localizado dentro de límites dados ( es la media de los valores, s es la desviación estándar).
x
x

• Derivan de histogramas o polígonos de frecuencias que se sustituyen por una curva
suavizada.
• El área bajo la curva representa al total de los casos en la población y es igual a una
proporción de 1 o un porcentaje igual al 100%.
•La curva normal es un modelo teórico o ideal sobre cómo debe comportarse la
distribución de las variables en una muestra.
•Representa una curva de distribución de frecuencias en la que la mediana, la moda y la
media de una variable son iguales entre sí.
Función de la dist.normal
( )
2
2
1
2t o
o
µ
|
.
|

\
| ÷
÷
= =
x
e
x f y
La distribución normal
Ejemplo:

Muchas variables relacionadas a atributos psicológicos, como la inteligencia
medida en términos de Coeficiente Intelectual (CI), se distribuyen en la
población tomando la forma de la curva normal, en que la mayoría de los
casos se encuentran en el centro (Moda), existiendo pocos casos en los
extremos, siguiendo el ejemplo del CI, existen pocos sujetos con inteligencia
muy baja por un lado y pocos genios por el otro, esto es lo que da a la curva
normal su característica forma de campana).
La distribución normal. Alcances de su aplicación
En los temas que serán abordados a continuación
realizaremos inferencias estadísticas relacionadas con la
distribución normal.
Muestra de
tamaño n
Población
de tamaño N
Consideraciones básicas para el estudio de la estadística inferencial
Con la muestra podemos calcular

n
x X f
s
¿
÷
=
2
2
) (
n
Xi
x
¿
=
Población
de tamaño N
Muestra de
tamaño n
Muestra de
tamaño n
Muestra de
tamaño n
Muestra de
tamaño n
Muestra de
tamaño n
Cada muestra con una media y
varianza diferentes
Es muy probable que una media muestral sea diferente a la media poblacional;
del mismo modo es muy probable que una varianza muestral sea distinta de la
varianza poblacional.
Esta diferencia, debido al azar, se llama: Error de muestreo (e)
2 2
s e
x e
muestreo de error e
÷ =
÷ =
=
o
µ
Cuando se toma una muestra de una población, se obtiene un estadístico muestral
;que son valores numéricos. Como es posible tomar muchas muestras , tenemos
varios valores de .
Como no se conoce los parámetros poblacionales el error de muestreo debe
fijarse.

) , (
2
o µ
2
s de y x
Con estos valores numéricos se puede hacer también tablas de frecuencias y de este
modo obtener su distribución.
Esta distribución se llama :Distribución muestral.
Se tiene entonces:
l
x x x x ........ ,
3 , 2
1
Todas las muestras son de
tamaño n
TEOREMA DEL LIMITE CENTRAL
Establece que si una población sigue una distribución normal, la
distribución de las medias muestrales obtenidas de esa población también
tienen una distribución normal.
Mas importante aún: si la población no es normal, la distribución de las
medias muestrales se puede aproximar a la normal si la muestra es
suficientemente grande, n es igual o mayor a 30.
Propiedades
1.- La media de la distribución muestral es igual a la media de la población.

x
x
µ µ =
2.-La varianza de la distribución muestral es igual a la varianza poblacional dividida
por el tamaño muestral
n
x
2
2
o
o =
3.- Si la población es normal o si n es igual o mayor a 30
x
) , (
2
n
N
x
o
µ
Error estándar de la media
Relación entre la media de la población y las medias muestrales
n
dar es error
o
= tan
ERROR ESTANDAR DE LA MEDIA
µ
x


La desviación estándar proporciona una unidad de medida común (estándar)
que permite comparar variables con diferentes medidas observadas

Supóngase que se tienen dos escalas para medir autoestima, la primera se
califica con un puntaje entre 0 y 20, y la segunda tiene calificaciones entre 0 y
50, si se compararan las calificaciones obtenidas por una y otra, los puntajes
brutos muy probablemente serían mayores en la segunda escala. Sin embargo,
si se considera la media de cada escala y las desviaciones estándar, es posible
conocer en términos de desviaciones estándar que puntuación se encuentra
por arriba de la media o por debajo de la misma, al comparar a dos personas.

CALIFICACIONES Z O ESTANDARIZADAS
Por ejemplo, el grupo calificado con la primera escala tiene una media de
15 y una desviación estándar de 4, para el segundo la media es de 35 con
una desviación estándar igual a 6. Supóngase que una persona tiene una
calificación de 19 en el primer caso y otra con 29 en el segundo caso. La
primera se encuentra por arriba de la media una desviación estándar y la
segunda una desviación debajo de la media, es decir, la primera persona
tiene un nivel de autoestima mayor que el de la segunda persona.
Las calificaciones brutas se transforman con frecuencia a otro tipo de
puntuaciones, para facilitar el análisis y la interpretación. Estas
calificaciones son derivadas o transformadas. Para facilitar la resolución
de éstos casos se usa la calificación estándar z .
A B
Media 15 35
s 4 6
Calif 19 29
CALIFICACIONES Z O ESTANDARIZADAS

Es una puntuación estandarizada. Su sentido es poder hacer comparaciones
dentro o entre sujetos, cuando han sido medidos con diferentes escalas.

La media de la z es 0
La s de la z es 1

Ventajas:

+ Miden una escala de intervalos, en términos de unidades de desviación
estándar.

+Permite comparar calificaciones de varias pruebas en forma directa,
incluso cuando se tienen medias y desviaciones estándar diferentes

CALIFICACIÓN O PUNTUACIÓN Z
Esta relación permite analizar, qué tanto se aleja la puntuación del sujeto de la
media, y luego se compara con la desviación estándar, en otras palabras, se
estandariza.
Al analizar la curva normal en términos de puntuaciones z, y recordando que el área
bajo la curva representa el 100% de los casos, una desviación estándar tomada a
cada lado de la media incluye un área de 68.26% de la total. Toda el área incluida
por 2 unidades de desviación estándar a ambos lados de la media comprenden el
95.44% de los casos, si se continúa a la tercer desviación estándar a cada lado de la
media.
La suma de todas las áreas abarcadas por 6 unidades de desviación estándar es
igual a 99.74% del total. El 95% del área bajo la curva, está entre 1.96 y –1.96
desviaciones estándar, el 99% entre -2.58 y 2.58 y el 99.9% entre –3.90 y 3.90, estos
tres grupos de desviaciones son particularmente importantes en la estadística
inferencial como se verá más adelante.
La calificación z se calcula como sigue:
s
X X
z
÷
=
Ejemplo:
a) Cual es el valor z de un valor de x=11 si la media de la
muestra es 10 y la desviación estándar es 1.
1
1
1
10 11
=
=
÷
=
z
z
s
X X
z
÷
=
1
1
1
10 9
÷ =
÷ =
÷
=
z
z
a) Cual es el valor de z de un valor de 9?


El área bajo la curva representa el 100%. La mitad representa el 50% de cada lado

El área bajo la curva es igual a 1 (convertida en términos de proporción)

Para conocer el área bajo la curva se necesitan las puntuaciones z
INTERPRETACIÓN DEL EL ÁREA BAJO LA CURVA.
Utilizando esta información se puede calcular el área comprendida entre dos puntos
con base en las puntuaciones crudas. Por ejemplo: Una población de 1000 personas,
tiene una media de edad de 75 años y una desviación estándar de 8, ¿cuantas
personas tienen entre 67 y 75 años?
Sustituyendo la media (75) en el centro y las desviaciones estándar a la izquierda o
negativas (-8) y a la derecha o positivas (+8), la respuesta es el 34.13% del total de la
población es decir 341 sujetos tienen entre 67 y 75 años.
+/- 2s=68,26%
x
-3 -2 -1 Z=0 +1 +2 +3
Representación de la DN y DN estandarizada del ejemplo de los viejitos
TABLA DE PUNTUACIONES Z POSITIVAS
Para hallar el área a la derecha de z=0
z=1,52
Metodología para el calculo de áreas en la distribución normal estándar
Área desde:
z=0
z= 1,52
La tabla entrega el área desde z= 1,52 hasta z=-∞ = 0,9357; pero debemos restar
el área desde 0 hasta 0,5.El área sombreada seria entonces: 0,9357-0,5= 0,4357.
La probabilidad se expresa como P(0,00<z<1,52) = 0,4357
Fig :6,3; Pag 317 JK
0,5000
0,4357
Hallar el área en la cola derecha de una curva normal
Encontrar el área bajo la curva normal a la derecha de z=1,52; P(z>1,52)
El valor de la tabla para 1,52 es 0,9357. Pero la zona sombreada o de interés es el
área total (1,00) menos el valor de la probabilidad 0,9357, es decir
0,0643.P(z>1,52) = 0,0643
Ej6.3 Pag 318 JK
Hallar el área a la izquierda de un valor positivo de z
Ej 6.3 JK Pag 318
Encuentre el área a la izquierda de z=1,52:P(z<1,52)
Solución: el área puede ser leída directamente de la tabla, en la parte
de las z positivas.
Área pedida: 0,936
Se tiene:
P(z<1,52)=0,936 (Aproximado por Minitab)

6.5
Área de la tabla
0,4115
El área a la izquierda de z= -1,35 se lee directamente de la tabla, en la parte de
las “Puntuaciones z negativas”.
Se tiene:
P(z<-1,35)=0,0885
Para hallar el área en la cola izquierda de una curva normal
6.6
Pag 319 JK
P(-1,5<z<2,1) = P(z< 2,1) - P(z<-1,5)
= 0,9821 – 0,0668=0,9153
Para hallar el área de una z negativa a una z positiva
Usar Minitab
Solución: El área sombreada es el
área entregado por la tabla al
leer z 2,1 menos el área
entregada por la tabla al leer z-
1,5
Grafico> Grafica de Distribución de
normalidad>Ver probabilidad> Aceptar
Area sombreada.
Elegir”valor x”.
Colocar valores de x elegidos.
Aceptar

Resolución de problema con Minitab
Los pesos de los niños del kinderganten “La tía Ramona” se distribuyen normalmente de
la siguiente manera:
Use Minitab para determinar los valores z de todos los valores
Realice <histograma con línea de tendencia.
Determine la probabilidad de que los niños pesen entre22 y 38 kg
Que pesen menos de 22 Kg
32
34
43
23
34
35
34
23
22
34
38
37
25
48
40
41
39
38
25
24
Aplicaciones Ejercicio 1 (Resuelto)
En el último año, el peso de los recién nacidos en una maternidad se ha distribuido
normalmente con parámetros µ= 3100 gramos y σ= 150 gramos.

Determinar:
a)Probabilidad de que un recién nacido pese mas de 3500 gramos.

Solución:

El área de la curva correspondiente a 2,67 es de 0,9962, pero como se pide valores
mayores a este valor de z será 1,000-0,9962=P(z>0,9962) = 0,0038
z>0,9962
b)Probabilidad de que los recién nacidos pesen entre 3100 y 3200 gramos.
000 , 2
150
3200 3500
667 , 2
150
3100 3500
2
1
=
÷
=
=
÷
=
z
z
P( z=2,67)=0,9962
P(z=2,00) =0,9772



P( z>2,000<2,667)=
0,9962-0,9772=0,0190

Solución
Resolver con Minitab
Ejercicio 2 (Clases)

La panadería Sureste elabora piezas de pan, cuya longitud se distribuye de
forma normal, con una media de 15 cm y una varianza de 2,25 cm.
Determinar:
La probabilidad de que una pieza de pan exceda los 18 cm.
La probabilidad de que una pieza de pan exceda los 15 cm.
La probabilidad de que una pieza de pan mida menos de 17cm.

El conocimiento previo por parte del investigador de las características de la
realidad de la población mejora o debe mejorar los resultados inferenciales
que se pueden obtener de la obtención de una muestra.

No es lo mismo intentar conocer la altura media de los habitantes de un
país, que el número de errores en una gran contabilidad, dado que la
naturaleza de su universo y por tanto el comportamiento poblacional son
distintos.

Es por ello, que para distintas "naturalezas" del problema han de plantearse
distintas soluciones, si bien todas, o casi todas, pasan por la aleatoriedad; de
ahí que se establezcan diversas "técnicas" o "métodos" de muestreo, de los
que brevemente enumeramos algunos.
Consideraciones para el uso de la estadística Inferencial
Muestra y población
Elementos de muestreo
El muestreo es el proceso mediante el cual es elegida una muestra desde la
población sometida a estudio. Un estudio estadístico, que esté basado en
una muestra y que pretenda ser serio y confiable, debe intentar obtener una
muestra representativa de la población, es decir, que describa
acertadamente las características de la población original.
Métodos de muestreo
Al enfrentarnos a la tarea de seleccionar una muestra para la realización de
un estudio lo primero que se nos viene a la mente es la selección aleatoria,
es decir, al azar. Pero plantear una selección al azar involucra tomar algunas
medidas que resguarden la representatividad de la muestra. No se puede
caer en la simplicidad de elegir a los primeros 25 o a las empresas que están
inscritas en las páginas amarillas; el muestreo al azar involucra un proceso
mas científico.
Entre los métodos aleatorios mas utilizados, se encuentran:
a) Muestreo aleatorio simple:
Consiste en seleccionar por sorteo a los individuos que formar parte de la
muestra. Este método de muestreo debe cumplir con dos requisitos:
1.- Cada individuo debe tener la misma probabilidad de ser elegido.

2.-La selección de un individuo no debe afectar la probabilidad de selección de
otro. Esto supone que la selección debiera ser con reposición, aunque ello
implique que un individuo pueda ser elegido mas de una vez.

b) Muestreo estratificado:
Este tipo de muestreo divide la población total en subgrupos homogéneos,
llamados estratos. Posteriormente la muestra es seleccionada
aleatoriamente en número proporcional al de los individuos que componen
cada uno de los estratos.
TIPOS DE MUESTREO
Ejemplo:
Para calcular el rendimiento de madera que puede tener un bosque se elige
una muestra de plantas para su análisis, de estos resultados dependerá la
estimación del rendimiento de las utilidades que se pueden obtener con su
explotación. Para la elección de la muestra se puede proceder de alguna de
las siguientes maneras:

•Asignar un número a cada una de las plantas que conforman el bosque. En
seguida sortear los números de las plantas que servirán de muestra
(Muestreo Aleatorio Simple).

•Dividir el bosque en sectores (cuadrícula) y seleccionar en forma aleatoria
un % de plantas en cada uno de los sectores (Muestreo estratificado)

Estimaciones
Estimación puntual
Una estimación puntual es un solo valor que se calcula a partir
de una muestra y que se usa como una estimación del
parámetro poblacional correspondiente:
p Muestra P
s Muestra
x Muestra
=
=
=
?
?
?
o
µ
Coeficiente de confianza:
Se usa para indicar la probabilidad de que una estimación por intervalo contenga
el parámetro poblacional.

Nivel de confianza:
Es el coeficiente de confianza expresado como porcentaje.
La estimación por intervalo se basa en el siguiente concepto:

La estimación por intervalos establece un rango (intervalo) dentro del cual
es muy probable que se encuentre el parámetro poblacional.
La estimación por intervalos para la media poblacional
|
|
.
|

\
|
n
N distribuye se x
2
;
o
µ
n
ianza un y media una con normal manera de n distribuye se muestrales medias Las
2
var
o
µ
o 0 ÷ = e 1 ]) , [ ( b a P
o 0 ÷ = s s 1 ) ( b a P

La "estimación por intervalo" consiste en determinar un par de valores a y b, tales que
constituidos en intervalo [a ,b] ; y para una probabilidad 1-o prefijada (nivel de confianza) se
verifique en relación al parámetro u a estimar se cumpla:

ó en otros términos:
.
Podemos considerar el nivel de confianza (1-o ) que hemos prefijado para la expresión
anterior como la probabilidad que existe (antes de tomar la muestra) de que el intervalo a
construir a partir de la muestra incluya el verdadero valor del parámetro a estimar. Refleja la
"confianza" en la "construcción" del intervalo y de que éste tras concretar la muestra
contendrá el valor a estimar. De ahí que en términos numéricos dicho nivel o probabilidad
haya de tomar un valor alto (0.9, 0.95, 0.99).
Evidentemente el complementario al nivel de confianza; es decir o, nivel de significación
supondrá las probabilidades de cometer el error de no dar por incluido el verdadero valor del
parámetro a estimar en un intervalo en el que realmente si está. De ahí y dado que se trata de
un error posible a cometer, su cuantificación en términos de probabilidad sea muy pequeña
(0.1, 0.05, 0.005,..).
La estimación por intervalos para la media poblacional
Cuanto mayor sea el nivel de confianza prefijado; la amplitud del intervalo de estimación
será también mayor y por tanto la estimación será menos precisa.
La estimación por intervalos para la media poblacional
1-α :Nivel de confianza
(0,90)
α/2: Nivel de significación α/2
Podemos , por tanto señalar que:
Existe un limite inferior y otro superior de confianza para la media estimada,
de acuerdo a la expresión anterior
n
Z x
o
o
2
÷ )
2
n
Z x
o
o
+
o
o o
o o
÷ = + s s ÷ 1 ) (
2 2
n
Z x u
n
Z x P
LIC= LSC=
La expresión que representa la forma de estimar un intervalo
para una media poblacional es la sigte:
Ejemplo 1
Se está realizando un estudio social y se desea calcular un intervalo de confianza para
la media en la cual una persona se gradúa de la enseñanza media. Se toma una
muestra de 200 personas y se determina una media de 17.5 años con una desv.
Estandar de 0.9 años. Determinar un intervalo para la edad promedio con una
confianza del 90%.
n
Z x
o
o
2
÷
LIC =
)
2
n
Z x
o
o
+
LSC =
Datos:
n=200
Media=17.5 años
s=0.9 años
σ~0.9 años
NOTA: en lamina siguiente
se explica como se
encuentra z a partir de un
area de la tabla
5%
5%
90%
z
LIC
LSC
años LIC
años LSC
LSC
3954 , 17 1046 , 0 5 , 17
6046 , 17 1046 , 0 5 , 17
200
9 , 0
645 , 1 5 , 17
= ÷ =
= + =
+ =
Nota: Se aproxima valor de la tabla :Calcular completo con Minitab.
Como se calcula z a partir de probabilidades leídas en tablas
Datos del ejemplo anterior:
Para encontrar la puntuación z localizada a
la izquierda remítase a la tabla A-2 y busque
un área de 0,05 en el cuerpo de la tabla,
esto da -1,645.

Para encontrar la puntuación z localizada a la derecha, remitirse al cuerpo de la tabla
y buscar y buscar un área de 0,95.Recordar que la tabla A-2 siempre entrega áreas
acumulativas a partir de la izquierda. El resultado es 1,645.
0,90
De ejercicio anterior. Como encontrar el valor de z en
minitab. Buscar con alumnos.
Tabla presenta las diferentes fórmulas que ayudaran a crear los intervalos.

Para la distribución Normal utilice la siguiente tabla:
Nivel de confianza o o/2

z
90% 0.1 0.05 1.645
95% 0.05 0.025 1.96
99% 0.01 0.005 2.576
En una población, cuya distribución se desconoce se obtiene una muestra (m.a.s.) de 2000
valores de la que resulta una media de 225 y una desviación típica de 10. Suponiendo que
la varianza muestral coincide con la poblacional, estimar un intervalo para la media de la
población con un nivel de confianza del 95%.
Ejemplo 2
Tendríamos 1- =0.95 luego =0.05; S=10 = (muestra grande n>30); n=2000, para
una población normal.
o o
o
95 . 0 ) (
2 2
= + s s ÷
n
Z x u
n
Z x P
o o
o o
el resultado sería : µ [224,56 , 225,44] con el 95 % de confianza.

Comprobar resultado en clases y uso de Minitab.

e
4000 = x
95 . 0 ) (
2 2
= + s s ÷
n
z x u
n
z x P
o o
o o
Se quiere obtener un intervalo de confianza para el valor de las ventas medias por hora que se producen en
un kiosco. Para ello realizamos una muestra consistente en elegir al azar las ventas que se realizaron
durante 1000 horas distintas; muestra cuyos resultados fueron: ventas medias por hora = 4000, y varianza
de dicha muestra S
2
=4000. Obtener dicho intervalo con un nivel de confianza del 95 %.
Queremos construir un intervalo para la media con las siguientes características:
Tamaño muestral = n = 1000, con muestreo aleatorio simple, la población no es normal ni conocemos su
varianza.
El resultado de la muestra es:
Si bien se trata de un intervalo para la media con varianza desconocida y población no normal, dado que el
tamaño muestral es grande podemos suponer normalidad y tomar como varianza poblacional a la muestral
así:

El resultado sería: µ e [3996,08 ; 4003,92] con el 95 % de confianza.

, S
2
=4000.
Ejemplo 3
Que sucede cuando n< 30?
Curva normal (n>30)
n=5
n= 8
f
x
95%
1.96 s
T de Student
2.571
2.306
Las ventas diarias de cierta oficina comercial se supone que siguen una distribución
normal. Para estimar el volumen medio de ventas por día se realiza una muestra de 10
días escogidos al azar, resultando que la media de las ventas de esos 10 días es 100 con
una desviación típica de 4. Dar un intervalo de estimación para el volumen medio de
ventas por día con una confianza del 95 %.
Ejemplo 3 Uso de tabla t de Student
Conocemos que, según la información que poseemos, estamos ante: Distribución normal;
n=10 (muestra pequeña); S=4 (poblacional desconocida); media muestral=100;
Para 1-o =0.95, luego o =0.05 con lo que
26 . 2 ) 9 (
2
= gl t
o
(según tabla t)
95 . 0 ) (
2 2
= + s s ÷
n
S
t x u
n
S
t x P
o o
resultado sería: µ [96,99 ; 103,01] con el 95 % de confianza.
Comprobar en clases con formulas y Minitab.
e
x
Ejemplo 4 t de Student
Se desea estimar el promedio de contenido de grasa por libra de carne para
hamburguesas que se venden en Mc Donalds. Para ello se compro una libra de carne
en cada una de la 9 tiendas elegidas al azar. Se cocinó la carne, se escurrió la grasa y se
pesó .
Los resultados en onzas fueron:
3,3
4,8
5,1
4,5
4,0
3,9
4,7
5,0
3,6
Estime con un 99% de confianza el verdadero contenido de grasa por libra de carne
para hamburguesas

n
s
t x
2
o
µ ± =
Intervalo de confianza para
Intervalo de confianza para las proporciones poblacionales
Anteriormente se señaló que la distribución normal es una buena aproximación de la
distribución binomial si el tamaño de la muestra es grande. Como la mayoría de las
situaciones en que se estudian proporciones los tamaños muestrales son grandes, por
lo general se usa la distribución normal para calcular intervalos de confianza para la
proporción de una población.
Una vez que se ha calculado la proporción muestral “p” se forma un intervalo de
confianza alrededor de éste valor muestral, que se convierte en la estimación por
intervalo para el parámetro poblacional “P” desconocido
El intervalo de confianza es:

( )
n
p p
z p P
÷
±
1
:
2
o
Ejemplo
Una encuesta indica que Obama (PD) aventaja a Romney (PR).
De 200 electores de la ciudad, elegidos al azar, el 46% declaró que votaría por Obama,
mientras que un 32% declaró que votaría por Romney.
El resto se manifestó indeciso.
Los analistas piensan que es muy poco probable que se produzca un cambio y
aseguran que Obama será reelegido..
Se construye un intervalo de confianza con el 95%.
( )( )
53 , 0 39 , 0
200
54 , 0 46 , 0
96 , 1 46 , 0 ; ÷ = ±
A
P
( )
37 , 0 27 , 0
200
68 , 0 32 , 0
96 , 1 32 , 0 ; ÷ = ±
B
P
Respuesta: Con un 95% de confianza, ganaría Obama porque Romney nunca lo
alcanza.
Resultados de Minitab: Prueba e IC para una proporción

Muestra X N Muestra p IC de 95%
1 92 200 0,460000 (0,389479. 0,531724)


Ejemplo para realizar en clases
Una empresa ha recibido reclamos por un electrodoméstico que comercializa. Para
resolver el problema, la empresa quiere conocer el % de electrodomésticos que tienen
problemas. Envía un cuestionario a sus clientes y lo contestan 1675 clientes, de estos, el
12% dijo haber tenido problemas.
La empresa decide iniciar un programa de mejoramiento de calidad si el valor de % de
personas que han tenido problemas es mas de un 10%.Con un 99% de confianza.
¿Qué decide la empresa?
Nota Realizar este ejercicio en minitab
Minitab: Estadística> estadísticas básicas>1 proporción
Datos resumidos
Nota 1: Ir a opciones para comprobar nivel de confianza
Nota 2; en Numero de eventos se debe colocar el numero total (si es porcentaje,
multiplicar numero de muestra por %/100)

Solución A :Uso de formulas.
Datos:
n=1675
1-α=99%
p:12%
z: 2,575



( )
n
p p
z p P
÷
±
1
:
2
o
( )
1675
12 , 0 1 12 , 0
12 , 0 :
2
÷
±
o
z P
( )
14 , 0 10 , 0 :
02 , 0 12 , 0 :
1675
88 , 0 12 , 0
12 , 0 :
2
÷
±
±
IC
P
z P
o
Prueba e IC para una proporción

Muestra X N Muestra p IC de 99%
1 201 1675 0,120000 (0,100356. 0,141842)

Solución B: Resultado de Minitab

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->