Está en la página 1de 45

ESTADÍSTICA

APLICADA

CLASE EN LÍNEA 2 – MÓDULO 2

Dra. Marlene Mercedes Astudillo


Vicente.
MUESTREO E INFERENCIA ESTADÍSTICA
MUESTREO

s1 s2

s4
s3

Herramienta de la investigación científica cuya función básica


es determinar qué parte de una población en estudio debe
examinarse con el fin de hacer inferencias sobre dicha
población.
MUESTREO ALEATORIO SIMPLE
TABLA DE KENDALL Y BABINGTON
MUESTREO POR CONGLOMERADO

Conglomerados
seleccionados.
EJEMPLO

Supongamos que el Ministerio de Sanidad quiere hacer en


su país para ver si un tratamiento ayuda a prevenir el
cáncer de colon. Si en los datos históricos se observa que
la incidencia y comportamiento del cáncer es parecido en
todas las comunidades, podríamos dividir el país en
comunidades y seleccionar algunas. Mediante el muestreo
por conglomerados se reducen notablemente los
individuos a estudiar, lo que implica reducir los costes
económicos.
MUESTREO ESTRATIFICADO
EJEMPLO
Imaginemos que hemos de recoger una muestra de 20 pacientes entre los 600 del hospital Santa
María. Además se conoce que el numero de pacientes por especialidad es el siguiente:
150 de Traumatología, 100 de Ginecología, 200 Cardiología, 150 de Gastroenterología.
Procederíamos:

20 = x x= 150 . 20 x= 5 5 Traumatología
600 150 600

20 = y y = 100 . 20 y = 3,3 ~ 3 Ginecología


600 100 600

20 = z z= 200 . 20 z = 6,6 ~ 7 Cardiología


600 200 600

20 = t t=5 5 Gastroenterología
600 150

20
MUESTREO SISTEMÁTICO
EJEMPLO

Se desea escoger una muestra probabilística de 16 hospitales, de una lista


de 160.
En este caso, se sigue el siguiente procedimiento:
➢ Se enumeran los 160 hospitales.
➢ Se divide la población entre la muestra. N / n = 160 / 16 = 10
➢ Se selecciona al azar un número entre 1 y 10, por ejemplo “3”
➢ Entonces :
1. a = 3
2. a + 10 = 13
3. a+ 2(10) 23
4. a + 3(10) = 33 .... Hasta

16. a+ 15(10) = 153.


PARÁMETROS POBLACIONALES Y
ESTADÍSTICOS MUESTRALES
• Es una cantidad numérica calculada Parámetros:
sobre una población y resume los
valores que esta toma en algún Media (m)
atributo. Intenta resumir toda la
información que hay en la población Varianza(s2)
Población
PARÁMETRO en unos pocos números (parámetros)
ejemplo: la altura media de los sujetos Desv. Est. (s)
Etc.

Inferencias
Muestreo
• Es una cantidad numérica Estadísticos:
calculada sobre la muestra
Muestras Promedio ( x )
ESTADÍSTICO que resume su información
sobre algún aspecto. Se usa Varianza muestral(S2)
para aproximar un parámetro. Desv. Est. muestral(S)
Etc.
EJEMPLO PARÁMETRO Y ESTADÍSTICO
Se tiene a la siguiente población de personas clasificadas como consumidores de drogas:
Suponga que estamos investigando sobre el porcentaje de personas consumidoras de alcohol,
calcule el parámetro y el estadístico adecuado. Para una muestra aleatoria simple de tamaño
n=6 de esta población.
Población

Muestra
SOLUCIÓN

❖ El Parámetro es el porcentaje de personas que


consumen Alcohol en la población de tamaño
N=22 personas,
P=(Número de personas que consumen Alcohol
N=
=6/22 = 0.2727 = 27.27%.
❖ El Estadístico es el porcentaje de personas que
consumen Alcohol en la muestra de tamaño n=6
personas, es decir:
p=(Número de personas que consumen Alcohol)
n
=3/6 = 0.50 = 50%.
EJERCICIO
1. Suponga que estamos investigando sobre el porcentaje de de personas que sufren de
diabetes de una población de 20 empleados de una empresa, de acuerdo al ultimo examen
médico, Indique cuál es el Parámetro y estadístico
Indique cuál es el Estadístico, si se tomo una muestra aleatoria simple de tamaño 6
de esta población.

Muestra

Población
TAMAÑO DE LA MUESTRA

POBLACIÓN FORMULA DE TAMAÑO DE LA MUESTRA PARA ESTIMAR


HOMOGENEA: UNA MEDIA ARITMÉTICA

n= Z2σ2N
E2 (N-1) + Z2σ2
__
E= Er. X
100

N= Población n = Tamaño de la muestra


Z = Desviación normal σ2 = Varianza
➢ FORMULA DE TAMAÑO DE LA MUESTRA PARA ESTIMAR
UNA PROPORCIÓN

n= Z2 P ( 1 – P ) N
E2 (N – 1 ) + Z2 P ( 1 – P )

➢ TAMAÑO DE LA MUESTRA CUANDO NO SE CONOCE LA


POBLACIÓN.
El valor de Z depende del grado de confianza

NC = 90% Z = 1,64
NC= 95% Z= 1,96
NC= 99% Z= 2,57
EJEMPLO:

Una empresa está interesada en realizar un estudio sobre el consumo de una


determinada marca de analgésicos, la población está constituida en 10 000 que
consumen analgésicos de diferentes marcas, se tiene interés en conocer el promedio y la
proporción de hogares que consumen está determinada marca de analgésicos y se
encuentra los siguientes resultados:
_
X= 250 P = 42% 𝝈 = 𝟐𝟖
Se pide
a) Calcula el tamaño de la muestra para estimar la proporción, considerando un grado de confianza del
95% y un error absoluto de E= 0,05 Además con el tamaño determinado, seleccione una muestra
sistemática de las 5 primeras unidades.
n= ( 1,96)2 ( 0, 42) ( 0,58) (10 000)
(0,05)2 ( 9 999) + ( 1,96)2 ( 0,42) ( 0,58 )
n= Z2 P ( 1 – P ) N
E2 (N – 1 ) + Z2 P ( 1 – P ) n= 360,70 n= 361

_
Para la muestra sistemática N / n
N = 10 000 X = 250 10 000 / 361 = 28
P = 42% 𝝈 = 𝟐𝟖 eliges un numero entre 1 y 28 escogí el 4
Z= 1,96 E = 0,05
1.- a= 4 = 4
2.- a + 1(28) = 4 + 28 = 32
3.- a + 2(28) = 60
4.- a+ 3(28) = 88
5.- a +4(28) = 116
b) Calcular un tamaño de muestra para estimar el promedio, considerando
un grado de confianza del 95% y un error relativo de 6%.
Sobre 100 si esta
n= Z2𝝈2N en %
E2 (N-1) + Z2𝝈2
__
E= Er . X = 6 ( 250 ) = 15
100 100

n = ( 1,96)2 (28)2 ( 10 000)


(15)2 (9 999) + ( 1,96)2 ( 28)2

n= 13,38
n = 14
EJEMPLO:

Se desea estimar la proporción de los estudiantes de la USMP, con un nivel de


aprendizaje de excelencia, para ello se define los siguientes criterios:
➢ Nivel de confianza 95%
➢ Proporción de estudiantes= 0,15
➢ Error máximo tolerable = 5%
n= (3,8416)2 (0,15) ( 0,85)
(0,0025)2

n= 195,9

n= (1,96)2 (0,15) ( 1 – 0,15) n= 196


(0,05)2
EJEMPLO:

Se desea estimar el ingreso promedio de las familias que viven en el


Municipio de San Juan de Lurigancho, para ello se definen los siguientes
criterios:
➢ Nivel de confianza 95% 2 ( 9,08,07)2 (50 000)
➢ Desviación estándar= 908.07 n= (1,96)
(200) 2 (50000-1) + (1,96)2 (908,07)2
➢ Error máximo tolerable = 200
➢ N= 50 000 n= (3,8416) ( 824591,1249) (50 000)
(40000) (49 999) +(3,8416)(824591,1249)

n= 79,01

n= 80
INFERENCIA ESTADÍSTCA

La Inferencia Estadística es
aquella rama de la Estadística
mediante la cual se trata de
sacar conclusiones de una
población en estudio, a partir
de la información que
proporciona una muestra
representativa de la misma.
INFERENCIA ESTADÍSTCA PUNTUAL

ESTIMACIÓN
POR
La inferencia Estadística INTERVALOS
puede dividirse en dos
apartados de acuerdo con
el conocimiento sobre la
distribución en la CONTRASTE DE
población: HIPÓTESIS
Estimación Puntual
Una estimación es puntual cuando se usa un solo valor extraído de la
muestra para estimar el parámetro desconocido de la población. Al valor
usado se le llama estimador.
La media de la población se puede estimar puntualmente mediante la
media de la muestra:
X=µ
La proporción de la población se puede estimar puntualmente mediante la
proporción de la muestra:
p =P
La desviación típica de la población se puede estimar puntualmente
mediante la desviación típica de la muestra, aunque hay mejores
estimadores:
S=σ
Estimación Por Intervalos
A veces es conveniente obtener unos límites entre los cuales se encuentre
el parámetro con un cierto nivel de confianza, en este caso hablamos de
estimación por intervalos.

Nivel de confianza

El nivel de confianza, C, indica, en porcentaje, con qué proporción el


intervalo de confianza contiene el parámetro estimado. El coeficiente de
confianza, c, es la misma proporción en tanto por uno, c = C/100. En otras
palabras, c es la probabilidad de que el intervalo de confianza contenga el
parámetro estimado.
Intervalo de confianza

Consiste en determinar, mediante un estimador, 2 valores numéricos


llamados límite inferior (L1) y límite superior (L2). Con un cierto grado de
confianza, se espera que estos límites contengan el valor del parámetro
que se quiere hallar.
.

Intervalo de confianza para la media m:


Ejemplo Intervalo de confianza
Se tienen los siguientes datos
_
X= 58 NC = 90%
n= 64 σ = 20
μ=X ±̅ Z σ
√n
= 58 ± 1,64 x 20/ √64
= 58 ± 1,64 x 20/8 62,1
= 58 ± 4,1 53,9
µ= [53,9 ; 62,1]
EJEMPLO

Se tiene interés en estimar la altura media de los estudiantes


de una institución educativa para el estudio de la incidencia
de plomo. Se recurre a una muestra aleatoria de 36
estudiantes y se obtienen los siguientes resultados:
x = 170 cm ; s = 20 cm

1° Error estándar de X = S

√n

= 20 = 20 = 3,3333….
√36 6
2° Si no se especifica el grado de confianza, se utiliza por lo general 95%, lo

cual corresponde a z = 1.96. Conociendo los datos. Se puede aplicar la fórmula:

= 170 ± 1,96 ( 3,333)


= 170 ± 6,53

= 170 + 6,53 = 170 – 6,53


=176,53 =163,47

→ Li = 163.47 cm
→ Ls = 176.53 cm
Por lo tanto, la estatura promedio de los estudiantes está comprendida entre 163.5 y 176.5
cm, con un grado de confianza del 95%.
→ I.C. 95% (163.5 ; 176.5 cm)
Intervalo de
confianza para la
proporción P
EJEMPLO

Supóngase que en una muestra de 2000 personas se encontró que 250 son
hipertensas. Calcular el intervalo de confianza al 95%.

1° El porcentaje de hipertensos en la muestra


es: p=250 x 100
2000
p =12.5%
2° Se halla el error estándar p(100 – p)

12,5 ( 100 – 12,5)


2000
12,5 x 87,5
2000

1093,75
2000

= 0,55
= 0,74
P= 12,5 ± 1,96 ( 0,74 )
3° P= 12,5 ± 1,45

P= 12,5 + 1,45 P= 12,5 – 1,45


P= 13,95% P= 11,05%
→ Li = 11,05%
→ Ls = 13,95%
Por lo tanto, con un nivel de confianza de 95%, se puede afirmar que
el porcentaje de hipertensos en la población se encuentra entre
11.05% y 13.95%.
→ I.C. 95% (11,05 ; 13,95%)
Muchas Gracias
TAREA Nº 2
Tarea Nº 2
1.La enfermera delegada está interesada en realizar un estudio sobre
el estado de la nutrición en niños de 5 años de edad de la comunidad
San Pedro. La población está constituida por 900 niños de 5 años de
edad. La delegada está interesada en particular en conocer la
proporción de niños de 5 años que están desnutridos y la estatura
promedio. Para tal efecto, realiza un estudio piloto y obtiene que:
• El 35% están desnutridos; y
• Además, se ha determinado con respecto a la estatura:
_
x = 120 cm
s = 20 cm
Se pide:
a. Calcular el tamaño de muestra para estimar la proporción de niños de 5
años de edad que están desnutridos, considerando un grado de confianza del
95% y un error absoluto de E=0.05. Además, con el tamaño determinado,
seleccione una muestra sistemática de las 10 primeras unidades.

b. Calcular un tamaño de muestra para estimar la talla promedio de los


niños de 5 años de edad, considerando un grado de confianza del 95% y un
error relativo del 8%.
2. Se desea estimar el tiempo medio de sangría en fumadores de más de 20
cigarrillos diarios, con edades comprendidas entre 35 y 40 años, con una
precisión de 5 segundos. Ante la ausencia de cualquier información acerca de la
variabilidad del tiempo de sangría es este tipo de individuos, se tomó una
muestra preliminar de 5 individuos, en los que se obtuvieron los siguientes
tiempos (en segundos): 97, 80, 67, 91, 73.
Determinar el tamaño de muestra, al 95%, para cumplir el objetivo anterior
DESVIACION ESTANDAR Y VARIANZA DE UNA
POBLACIÓN PARA DATOS NO AGRUPADOS

Desviación Varianza: La media


Estándar o Típica: aritmética de las
Indica cómo se desviaciones cuadradas
dispersan los datos con de la media.
respecto a la media
Varianza: Corresponde a
Desviación Estándar: la Desviación Estándar al
Corresponde a la Raíz cuadrado
Cuadrada de la Varianza
 (X - m)2
s s 
=
s 2 =
N
EJEMPLO PARA DATOS NO AGRUPADOS
• Calcular varianza y desviación estándar para los siguientes puntajes
de una población.
• 10 – 12 – 17 – 18 - 23 x=16
Nº x x-x (x - x)2
1 10 -6 36 VARIANZA
2 12 -4 16
3 17 1 1
MEDIA
4 18 2 4
s 
=  (X -Xm)2
5 23 7 49 N
∑ 80 106

s= s2 DESVIACIÓN
ESTÁNDAR
σ2 = 106
5
σ = √21,2 σ =4,6 σ 2 = 21,2
3. En los trabajadores administrativos de la Universidad Particular San Martín
de Porras estamos interesados en conocer el colesterol promedio y la
proporción de obesos. Para tal efecto, se recurre a una muestra de 81
trabajadores y se obtienen los siguientes resultados:
_
X=250 , s=30 y
a=10 obesos.
Se pide estimar por intervalo con un grado de confianza del 95% el
colesterol promedio y la proporción de obesos en los trabajadores
administrativos de la USPM.
4. En una determinada región se tomó una muestra aleatoria de 125
individuos, de los cuales 12 padecían afecciones pulmonares.
a. Estímese la proporción de afecciones pulmonares en dicha región.
b. Si queremos estimar dicha proporción con un error máximo del 4%,
para una confianza del 95%, ¿qué tamaño de muestra debemos tomar?

5. Una muestra de 100 hombres adultos aparentemente sanos, de 25


años de edad, muestra una presión sistólica sanguínea media de 125. Si
se supone que la desviación estándar de la población es de 15, calcular el
intervalo de confianza del 90 por ciento para µ.
PROPORCIÓN

P = Número de afectados entre el


total

También podría gustarte