Está en la página 1de 48

INFERENCIA

ESTADÍSTICA
INFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA

Es la rama de la estadística que tiene por


objeto estudiar la población a través de
las evidencias proporcionadas por la
muestra.
INFERENCIA ESTADÍSTICA

Uno de los principales problemas que se presentan en la


estadística es el de hacer afirmaciones sobre los parámetros
poblacionales (generalmente desconocidos). Por ejemplo
altura media de la población masculina de una determinada
región, producción total de granos de un determinado país
en un determinado año.
INFERENCIA ESTADÍSTICA

Muestreo
Muestra confiable y
Población Muestra representativa
  Media → x
2  Varianza → s2
P  Proporción → p̂
  Total → ˆ
Parámetros Estadisti cos

Inferencia
MUESTREO
ESTADÍSTICO
¿Razones para muestrear?
• Reducir la utilización de recursos financieros, humanos y
materiales para realización de estudio
• Realizar el estudio en menor tiempo.
• Minimizar daños a la población, en los casos que la
recolección de datos conlleva destrucción de los
elementos.
Población Natural

Es el universo que abarca la totalidad de


entes que tienen características en
común. Se conoce su distribución espacial
y temporal pero generalmente se
desconoce su tamaño.
Población objetivo
Es el universo que abarca la totalidad de entes sobre los
qué o quienes se requiere obtener información. Se
obtiene de delimitar la población natural, es decir, de
establecer cuáles serán las características que deben cumplir
los entes objeto de estudio, en términos de homogeneidad,
tiempo, espacio y cantidad.
Muestra

Es un subconjunto de entes de la
población objetivo, sobre los qué o quienes
recae la recolección de datos. Y que se
supone son representativos de la
población.
Unidad de muestreo

Elemento o subconjunto de elementos de


la población, no traslapados, del que se debe
obtener información para realizar el estudio.
También se le llama unidad de análisis.
Marco de muestreo
Unidad física o electrónica que sirve como referencia para
identificar o localizar la totalidad de unidades de muestreo
que constituyen una población. Puede ser:
a)Una lista depurada de personas, plantas, animales o cosas.
b)Un plano o mapa de ubicación de parcelas, hogares,
plantas o cosas.
Población
Población objetivo
natural N=70

Muestra
Unidad de
muestreo

n=9
Muestreo probabilístico

Cada unidad de análisis tiene una probabilidad de ser elegida, lo


cual determina la situación de poder generalizar los hallazgos del
estudio a toda la población objetivo.
Sólo estos métodos de muestreo probabilístico nos aseguran la
representatividad de la muestra extraída y son, por tanto, los más
recomendables.
Muestreo aleatorio simple (MAS)
• Primero se prepara un marco muestral, que es una lista de todas las unidades,
después se decide el tamaño de la muestra, y se selecciona del marco,
utilizando procedimientos aleatorios (números, tablas, software, etc).
• Este procedimiento consiste en seleccionar n elementos de una población de
tamaño N, de modo que todas las muestras posibles de tamaño n, tengan la misma
probabilidad de ser seleccionada.
• implica contar con un listado de todos los elementos del universo y esto lo hace muy costoso y
en oportunidades imposibles de realizar.
Muestreo aleatorio estratificado
• Se basa en dividir el conjunto N de elementos en L subconjuntos o estratos, mediante
variables de control llamadas variables claves de estratificación, las cuales deben estar
correlacionadas con las variables en estudio. Estas variables agrupan los elementos de la
población en L partes, tratando que sean cada uno de sus elementos lo más homogéneos
posibles y las L partes heterogéneas entre ellas,
• Al tener esta población dividida en partes y aplicarle a cada parte la selección por muestreo
aleatorio simple, se obtiene un muestreo estratificado aleatorio.
Muestreo sistemático
Consiste en aplicar un método sistemático de selección de los elementos que
conformaran la muestra. Es decir, consiste en numerar los elementos de la
población del 1 a N, en cualquier orden, luego dividirla en n partes de tamaño K=N/n
(intervalo de selección sistemática) y elegir un numero al azar entre 1 y K que se designa por i
(origen aleatorio) y de allí en adelante tomar los elementos que ocupen la misma posición en
los K sucesivas partes restantes, en total n-1.
Muestreo por conglomerados
• Los conglomerados son grupos o agrupaciones de elementos que existen
naturalmente y no los define el investigador. Se selecciona una muestra
aleatoria no de sujetos, sino de grupos de individuos, como familias, casas,
pueblos, escuelas, municipios, etc. Lo anterior implica que debemos contar
con un listado de los conglomerados, y no de los sujetos de estudio.
• El muestreo por conglomerados es adecuado cuando las unidades de estudio
están geográficamente dispersas.
Muestreo polietápico
• Muestreo en el que se procede en etapas. El muestreo poli-etápico o multi-
etápico consiste en seleccionar las unidades de investigación en varias fases o
etapas.
• En el muestreo en dos etapas (bi-etápico), se divide a la población en
unidades muestrales primarias (cursos escolares, pacientes que acuden a
consulta determinados días determinados al azar), y se selecciona a
continuación una muestra de dichas unidades primarias mediante muestreo
aleatorio simple, estratificado o sistemático.
Muestreo NO probabilístico
• Muestreo por cuotas
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número
de individuos que reúnen unas determinadas condiciones, por ejemplo: 20
individuos de 25 a 40 años, de sexo femenino y residentes en Guastatoya.
Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas características.
Muestreo por juicios, opinático o
intencional
Muestreo en el que la persona que selecciona la muestra procura que esta sea
representativa. Los elementos de la muestra son elegidos a criterio del
investigador sobre lo que él cree que pueden aportar a su estudio. Por
consiguiente, la representatividad depende de su intención u opinión, y la
evaluación de la representatividad es subjetiva. No tiene fundamento
probabilístico
Muestreo casual, incidental o por
conveniencia
El investigador selecciona directa e intencionadamente los individuos de la
población porque él investigador cree que son convenientes para su
estudio, o porque se tiene fácil acceso a la muestra. Algunos ejemplos son las
muestras obtenidas de instituciones de salud, de consulta externa, de los
pacientes de un medico o de voluntarios disponibles. Otro caso frecuente de
este procedimiento es cuando los profesores de universidad emplean a sus
propios alumnos.
Muestreo bola de nieve
Se localiza a algunos individuos (los que cumplan con los criterios de admisión),
los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra
suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones "marginales", delincuentes, drogadictos, sectas, determinados
tipos de enfermos o enfermedades raras, etc.
CÁLCULO DEL
TAMAÑO DE UNA
MUESTRA
Importancia del cálculo de una muestra
• Las muestras pueden ofrecer datos que permitan hacer inferencias sobre toda la
población. Es a través de los datos recopilados de una muestra que los
encuestadores pueden aproximar cosas sobre una población.
• Un estudio que tiene un tamaño de muestra demasiado pequeño puede producir
resultados no concluyentes debido a la falta de información.
• Un estudio demasiado grande desperdiciará recursos y podría exponer a más
participantes de los necesarios a cualquier riesgo relacionado.
• Tiene que ser el tamaño de muestra adecuado para realizar el estudio o
experimento.
µ, σ, P
.

población

Ẋ, s, p

muestra
Para calcular el tamaño adecuado de
una muestra se utilizan las 4
fórmulas siguientes:
Fórmulas para estimar proporciones

Poblaciones desconocidas Poblaciones conocidas


Fórmulas para estimar una media

Poblaciones desconocidas Poblaciones conocidas


Criterios para
seleccionar las
fórmulas:
Estimación de proporciones

Para estimar proporciones (resultados en porcentajes). Para


poblaciones infinitas( muy grandes) o desconocidas utilizar:
no: tamaño de la muestra
Z: puntuación según el nivel de confianza
p: probabilidad que ocurra el suceso
q: probabilidad que no ocurra el suceso (1-p)
E: error
Si no hay información previa o encuesta, se considera p = q, ambas
tienen la misma probabilidad de ocurrencia, es decir, 50% cada una.
Estimación de proporciones

Para estimar proporciones (resultados en porcentajes). Para


poblaciones conocidas utilizar:
no: tamaño de la muestra
Z: puntuación según el nivel de confianza
p: probabilidad que ocurra el suceso
q: probabilidad que no ocurra el suceso (1-p)
E: error
N: tamaño de población
En este caso sí conozco la población y hay información anterior.
Estimación de promedios

Para estimar promedios con poblaciones desconocidas


utilizar:
n: tamaño de la muestra
Z: puntuación según el nivel de confianza
σ: desviación estándar
E: error
Estimación de promedios

Para estimar promedios con poblaciones conocidas utilizar:


n: tamaño de la muestra
Z: puntuación según el nivel de confianza
σ: desviación estándar
E: error
N: tamaño de la población
En este caso sí conozco la población y hay información anterior.
Antes de calcular el tamaño de la muestra deben
establecerse lo siguiente:

El nivel de confianza con el que se desea realizar la


estimación.

El margen de error máximo tolerable.


NIVELES DE CONFIANZA
COMÚNMENTE
UTILIZADOS
Niveles de confianza
Los niveles de confianza
comúnmente utilizados
son los del 90, 95 y 99%.
También existen otros
como se muestra en la
tabla siguiente:
EJEMPLOS UTILIZANDO
LAS 4 FÓRMULAS
Ejemplo 1 : Se desea estimar la proporción de niños de una ciudad que prefieren jugar con el PS5, la
nueva consola de video juegos, se desea calcular con confianza del 95% y un error del 5%. Calcule el
tamaño de la muestra de los niños que debería encuestarse.

Para una confianza del 95% corresponde una Z de 1.96


Datos:
(1.96)2 ∗0.5∗0.5
Confianza 95% 𝑛= = 384.16
(0.05)2

p = q = 50% = 0.50 La muestra n que debería tomarse es de 384 niños.


E= 5% = 0.05
No tenemos información previa o encuesta, entonces se considera p = q, es decir ambas tienen la misma
probabilidad de ocurrencia. No conocemos la población.
Ejemplo 2: En una ciudad hay 4500 familias, en una encuesta anterior solamente el 22% de los niños
manifestaron jugar con la consola Wii. Con una confianza del 90%, y un error del 10%. Calcule el
tamaño de la muestra de familias que deberían encuestarse.

Para una confianza del 90% corresponde una Z de 1.65


Datos:
4500 ∗ (1.65)2 ∗0.22∗0.78
N= 4500 𝑛= 4499 0.10 2 + 1.65 2 ∗0.22∗0.78
=45.97

p = 0.22
q = 0.78 La muestra n que debería tomarse es de 46 familias.
E= 10% = 0.10
En este caso, conozco la población y hay información anterior (encuesta), solo quiero actualizar
la información.
Realice el mismo ejercicio con los siguientes
valores:
• Nivel de confianza del 95% y un error del 5%
• Nivel de confianza del 99% y un error del 5%
• Nivel de confianza del 95% y un error del 10%
• Nivel de confianza del 99% y un error del 10%
• Nivel de confianza del 95% y un error del 15%
• Nivel de confianza del 99% y un error del 15%
Realice el mismo ejercicio con los siguientes
valores:
• Nivel de confianza del 95% y un error del 5% = 249 familias
• Nivel de confianza del 99% y un error del 5% = 415 familias
• Nivel de confianza del 95% y un error del 10% = 65 familias
• Nivel de confianza del 99% y un error del 10% = 111 familias
• Nivel de confianza del 95% y un error del 15% = 29 familias
• Nivel de confianza del 99% y un error del 15% = 50 familias
Ejemplo 3: Se desea estimar el gasto promedio mensual en quetzales que una familia de la ciudad de
Guatemala gasta en abarrotes. Calcule cuántas familias se deben tomar como muestra con una confianza
del 99% y un error de Q.3.00. Se ha estimado una desviación estándar de Q7.00

Para una confianza del 99% corresponde una Z de 2.58


Datos:
(2.58)2 ∗(7)2
Confianza 99% 𝑛= (3)2
= 36.13

σ=7 La muestra n que debería tomarse es de 36 familias


E= 3
No conocemos la población.
Ejemplo 4: Se desea estimar el gasto promedio mensual en quetzales que una familia de la ciudad de
Guatemala gasta en abarrotes. Realice el cálculo para una nueva urbanización con 1900 familias con un 99% de
confianza y un error de Q2.50, considerando la desviación estándar con un valor de Q8.00.

Para una confianza del 99% corresponde una Z de 2.58


Datos:
(2.58)2 ∗ 8 2 ∗1900
N= 1900 𝑛= 2.50 2 ∗ 1899 + 2.58 2 ∗ 8 2
= 65.64

σ=8
E = 2.50 La muestra n que debería tomarse es de 66 familias.
En este caso, conozco la población.

También podría gustarte