Está en la página 1de 52

INFERENCIA ESTADÍSTICA

 PARTE DE LA ESTADÍSTICA CUYAS TECNICAS


PERMITEN GENERALIZAR LOS RESULTADOS
OBSERVADOS EN UNA MUESTRA A LA
POBLACIÓN CORRESPONDIENTE.

 EN BASE A UNA MUESTRA SE ESTIMA UN


PARAMETRO POBLACIONAL CON CIERTO
MARGEN DE CONFIABILIDAD Y/O ERROR.
F. PROCESO ESTADISTICO

Población o
Universo
(Parámetros)
Muestreo
Inferencia
(Muestra) Estadística
(Generaliza
Resultados)
Estadística
Descriptiva
(Muestra)
MUESTREO

PROCEDIMIENTO
UTILIZADO PARA
SELECCIONAR UNA
MUESTRA
REPRESENTATIVA DE UNA
POBLACIÓN
MUESTRA REPRESENTATIVA
Una muestra es representativa de la población de la cual se selecciona si diverge
de esta sólo en tamaño pero mantiene su estructura.

 Población

N= tamaño poblacional

Ä + © @ n= Tamaño muestral
Ä © @  +Ø
Ä @ +Ø ©  © @
Ø ©@ n<<N
+  Ø
 +Ø © @ 
RAZONES PARA USAR EL MUESTREO
 El costo elevado al examinar toda la población
 La imposibilidad de estudiar toda la población, como por ejemplo, todos los estudiantes de primaria del
Perú.
 Las limitaciones de tiempo, como las que recaen sobre loes encuestadores políticos entes de una
elección
 El carácter destructivo de ciertas unidades experimentales, por ejemplo al estudiar el tiempo de vida
útil de focos de luz de cierta marca.

Ventajas de utilizar muestras

 Ahorra dinero, tiempo y trabajo


 Permite una mayor exactitud en el estudio
 Es posible medirse los errores atribuibles al observador, al
objeto observado y al método de observación y de esta manera
controlarlos y disminuir convenientemente.
CONDICIONES DE UNA BUENA MUESTRA
Una buena muestra debe cumplir con las siguientes
condiciones:
 
 BUENA EN CANTIDAD. Si incluye un número óptimo
de individuos o unidades de estudio, así por ejemplo
si, si na enfermedad se presenta tan sólo en un 1% de
la población, habrá la necesidad de estudiar por lo
menos100 personas, para tener la posibilidad de
hallar un caso (persona enferma), pero si la incidencia
es de 50%, basta estudiar dos personas.
• BUENA EN CALIDAD. Si refleja fielmente
las características de la población de
la cual procede y difiere de ella sólo
en el número de unidades incluidas
ETAPAS DEL MUESTREO
Los pasos principales para la recolección de los datos de una
muestra son:
 
 Definir explícitamente la unidad de análisis
 Definir claramente la población que va a ser muestreada
 Seleccionar bien las variables que van a ser observadas en
cada unidad que se va a analizar
 Explicar el grado de precisión deseada
 Seleccionar la unidad muestral. En algunos casos es obvia,
como en el caso de una población de estudiantes de una
institución educativa, donde la unidad es un estudiante. En
otras ocasiones debe escogerse la unidad muestral, como en
el caso de muestreo de residentes de una ciudad, donde la
unidad es una persona, una familia, o las familias de una
cuadra.
 Seleccionar la muestra, después de haber determinado el
tamaño de muestra respectivo
Términos Básicos
 Población o Universo.
Se define como el conjunto de todas las unidades de análisis cuyas
características o atributos se van a estudiar en un lugar o período
establecido. La población tiene su variabilidad la cual debe ser
identificada, cuantificada e interpretada. Tiene también regularidad y
constancia. Según el tamaño de la población puede ser finita o infinita

Ejemplo. Gran número de paquetes de verduras congeladas durante 8


horas; un lote de quesos elaborados durante una jornada de 8 horas, etc.

 Unidades elementales (Elemento o unidad de análisis):


Es la unidad acerca de la cual se solicita información. Esta unidad es
la que suministra la base del análisis.

“Son las unidades que representan las partes más pequeñas de los
elementos capaces de presentar una característica particular”

Ejemplo. Un paquete de verduras; una porción de queso


 Marco de Muestreo (Marco Muestral)
La definición de una población debe ser operativamente factible. Para
determinar la factibilidad, debe construirse una lista con la cual identificar las
unidades de análisis. Esta lista es llamada marco de muestreo, población de
trabajo o población muestreada. Los dos últimos nombres sugieren que el

marco es la población operativamente factible o la población que puede ser


muestreada realmente.

 Población objetivo (blanco). En contraste, la población


originalmente definida o la que se pretende muestrear se conoce como
población objetivo (blanco)

El éxito o el fracaso de un estudio estadístico depende de la población de


trabajo disponible.

Si el marco es diferente de la población objetivo, pero puede juzgarse que el


primero contiene información adecuada, el estudio puede continuarse. Pero
debe recordarse que las inferencias estadísticas se relacionan con la
población marco
Unidad de muestreo:
Cada uno de los elementos que comprende la base de la
muestra y que figuran numerados e individualizados en el
registro (marco muestra).

“Son las unidades que sirven de base para las


operaciones de muestreo, pueden ser: (i) las mismas unidades
elementales o (ii) grupos de elementos que conforman un
conglomerado de unidades elementales
Fecha y duración: Los períodos de tiempo son importantes
en cualquier encuesta:

(i) El período de referencia: la fecha o el período a que se


refieren los datos, así como,

(ii) La referencia a la duración: la fecha inicial y final del trabajo


de campo.
Ejemplo
Estudio del mercado potencial nacional para el lanzamiento de un
complemento dietario en cápsulas.

 Unidad elemental: Hombres y mujeres mayores de 18 años, residentes


en centros urbanos del país de más de 500.000 habitantes, con
hábitos alimenticios que conlleva una dieta desequilibrada (‘fast food’).

 Unidad de muestreo: Unidades 1ª Ciudades de más de 500.000


habitantes, 2ª Barrios o distritos escolares, 3ª Manzanas (conglomerado o
áreas de nueve manzanas), 4ª Viviendas, 5ª Unidades familiares (hogares),
6ª Hombres y mujeres mayores de 18 años que poseen dichos hábitos
alimenticios.

 Cobertura: Nacional.
Períodos: 1. Referencia de los datos: hábitos alimenticios durante el
último año.
2. Fechas de campo: del 15 al 30 de noviembre de 2021.
Prueba de producto de un herbicida.

 Unidad elemental: Ingenieros Agrónomos a cargo de


establecimientos agropecuarios.

 Unidad de muestreo: Unidad Primaria: Municipios o


provinvias de la zona Cajamarca, Unidad Secundaria:
Establecimientos agropecuarios con terrenos para el pastoreo
de más de 10 hectáreas.

 Cobertura: Provincias de Cajamarca.

 Períodos 1. Referencial de los datos: prueba del herbicida durante


un mes.
Aplicación de la primera parte del cuestionario del product-test,
y la segunda, luego de la aplicación del producto en el terreno.
2. Fecha de campo: Enero y febrero de 2022
 Probabilidad de selección
Es la probabilidad que tiene cada unidad de muestreo en la población de ser incluida en la muestra

 Error. Los errores estadísticos son de dos clases: no muestrales y muestrales

 El error no muestral comprende los sesgos y equivocaciones en cualquiera de las etapas desde la
recolección de datos hasta la obtención de resultados. Se presenta tanto en el muestreo como en el
censo. No puede ser estimado objetivamente pero puede ser reducido en gran medida con el proceso
bien realizado.

 El error de muestreo, es la diferencia entre el valor de un estadístico y el del parámetro correspondiente.


P: % de producción defectuosa en un período de producción
Notación | P - p | p: % de producción defectuosa en un período de producción (muestra).

 Error total = Error no muestral + Error muestral

 En un censo: el error es mayor, grande no estimable

 En un muestreo: el error es menor, pequeño estimable

 El error no muestral puede presentarse al entrevistar, por


comodidad, a un individuo no seleccionado, al visitar un hogar
que no corresponde a la dirección seleccionada, al tomar una
porción de alimento de otro lote.
Teoría de muestreo
 Población finita
 Población infinita se necesita hacer mas muestras porque se carece de un marco muestral

Muestreo

Probabil ístico
Probabilístico No
No Probabil ístico
Probabilístico

 Definición del conjunto de muestras


 Asignación de Probabilidad ( i )
 Selección ( i )
 Estimación
Tipos de Muestreo
probabilístico

¨ Muestreo Aleatorio Simple

¨ Muestreo Estratificado

¨ Muestreo Sistemático

¨ Muestreo por Conglomerado

¨ Muestreo Múltiple (AGRUPADO)


Muestreo Aleatorio Simple
Proceso de selección de una muestra donde cada uno de los
elementos de la población tienen igual probabilidad de ser
incluidos en la muestra.

Teóricamente el muestreo aleatorio puede ser practicado en una


población finita o infinita y puede ser con o sin reemplazo.

En la práctica, el muestreo siempre se realiza sin reemplazo..

Restricción.
Para aplicar el M.A.S. es necesario de que la población sea
altamente homogénea respecto a la característica de mayor
interés de estudio, y además que las unidades se encuentren
concentradas.
TEORICAMENTE
CON REEMPLAZO Y SIN REEMPLAZO

En la práctica se hace sin reemplazo para no repetir la muestra


Procedimiento para seleccionar una muestra al
Azar

1.Se confecciona una lista de todos los elementos de


la población (Marco muestral) y se les
asigna números de 1 hasta N (tamaño poblacional)
2.La unidad de base de la muestra debe ser la misma.
3.Se determina el tamaño de la muestra (n)
4.Se extraen al azar los n elementos. Se pueden
utilizar los procedimientos:
* Tabla de números aleatorios.
* Sistema de la lotería
* Cualquier otro procedimiento al azar
La muestra queda constituida por los n elementos
que hemos obtenido de la población
TAMAÑO MÍNIMO DE MUESTRA
 Hasta ahora se ha supuesto un tamaño de muestra dado,
interesa analizar brevemente cuáles son los factores
determinantes de la magnitud de “n”.
 Fundamentalmente hay cuatro factores condicionantes
del tamaño de muestra:
 Variabilidad de la población: ( σ2 )
 Error máximo tolerable en la estimación (Precisión de las
estimaciones) : E
 Nivel de confianza: Zα/2 , (Coeficiente de 1-α de confianza)
 Tamaño de la población. (N)
 Además hay un quinto elemento de extraordinaria
importancia práctica: los recursos financieros y recursos
humanos y materiales.
 Del equilibrio de todas estas condicionantes se determina
la magnitud del tamaño mínimo de muestra de muestra.
TAMAÑO DE MUESTRA PARA LA ESTIMACIÓN DE LA MEDIA
POBLACIONAL ( )

Cuando no se conoce el tamaño de población.


 Z21-α/2 2
 n -------------
 E2
 Donde:
 n= Tamaño mínimo de muestra
 Z1-α/2= Coeficiente de (1-α)% de confiabilidad
  = Desviación estándar poblacional.
 E = Error máximo tolerable en la
estimación de la media .
Ejemplo
Se sabe que el contenido de fructosa de cierto alimento sigue una distribución normal, cuya varianza es
conocida, teniendo un valor de 0,25. Se desea estimar el valor de la media poblacional mediante el valor de la
media de una muestra, admitiéndose un error máximo de 0,2 con una confianza del 95%. ¿Cuál ha de ser el
tamaño mínimo de muestra?
Solución

Como la varianza es 0.25, σ = 0.5 Desviación estándar: raíz cuadrada positiva de la varianza
Z1-α/2 = 1.96. Z 1-α/2
E = 0.2
Sustituyendo datos en la fórmula se tiene: (1-α/2) = 1 – ((1-95%)/2)

( 1.962 )* (0.5)2 = 1 – ((1-0.95)/2)

n≥ --------------------- = 24.01, Por tanto n = 25


( 0.2 )2 = 1 – (0.05/2)
0.025 + 0.025 + 0.95 = 1

Z1-α/2 = 1.96

0.95 + 0.025 = 0.975


TAMAÑO DE MUESTRA PARA LA ESTIMACIÓN DE LA MEDIA
POBLACIONAL ( )

Cuando se conoce el tamaño de una población (N)


N Z21-α/2 2
 n --------------------------
 (N-1)E2 + Z21-α/2 2
 Donde:
 n= Tamaño mínimo de muestra
 Z1-α/2= Coeficiente de (1-α)% de confiabilidad
  = desviación estándar poblacional.
 E = Error máximo tolerable en la estimación de la media
.
 N = Tamaño de la población
EJEMPLO
Se sabe que el contenido de fructosa de cierto alimento sigue una distribución normal, cuya varianza es
conocida, teniendo un valor de 0,25. Se desea estimar el valor de la media poblacional mediante el valor de la
media de una muestra, admitiéndose un error máximo de 0,2 con una confianza del 95%. ¿Cuál ha de ser el
tamaño mínimo de muestra?. Asumir que N=2000 Unidades enlatadas.
Solución

N= 2000 unidades.
Como la varianza es 0.25, σ = 0.5
Z1-α/2 = 1.96.
E = 0.2
Sustituyendo datos en la fórmula se tiene
N Z21-α/2 2
n --------------------------
(N-1)E2 + Z21-α/2 2

2000 x (1.96^2) x (0.5^2)


------------------------------------------
1999 x (0.2^2) + 1.96 x (0.5^2)

23.375

n = 24

Cuando no se conoce el tamaño de población el tamaño de muestra es más grande


TAMAÑO DE MUESTRA PARA LA ESTIMACIÓN DE LA
PROPORCIÓN POBLACIONAL (P )
Binomial
 Cuando no se conoce el tamaño poblacional
 Z21-α/2 P Q
 n -----------------
 E2
 Donde:
 n = Tamaño mínimo de muestra
 Z1-α/2= Coeficiente de (1-α)% de confiabilidad
 P = Proporción de casos que en la población tienen cierta
característica de interés.
 Q = Proporción de casos que en la población no tienen la
característica de interés.
E = Error máximo tolerable en la estimación
de la proporción P
Ejemplo: 4
Se desea hacer una encuesta para determinar la proporción de
familias que carecen de medios económicos para atender los
problemas de alimentación. Existe la impresión de que esta
proporción está próxima a 0.35. Se desea determinar un
intervalo de confianza del 99% con un error de estimación de
0.05. ¿De qué tamaño debe tomarse la muestra?
Solución
Z1-α/2 = 2.58
E = 0.05
P = 0.35, Q = 0.65
( 2.582 )* (0.35* 0.65)
n≥ ------------------------------- = 605.7324 = 606
( 0.05 )2
TAMAÑO DE MUESTRA PARA LA ESTIMACIÓN DE LA
PROPORCIÓN POBLACIONAL (P )

 Cuando se conoce el tamaño poblacional (N)


 N Z21-α/2 P Q
 n ----------------------------
 (N-1)E2 + Z21-α/2 P Q
 Donde:
 n = Tamaño mínimo de muestra
Z1-α/2 = Coeficiente de (1-α)% de confiabilidad
 P = Proporción de casos que en la población tienen cierta
característica de interés.
 Q = Proporción de casos que en la población no tienen la
característica de interés.
 E = Error máximo tolerable en estimación de la proporc. P.
 N = Tamaño de la población.
EJEMPLO
En un pueblo joven de 1500 viviendas, determinar el tamaño mínimo de muestra para estimar la verdadera
proporción de viviendas sin servicio básicos con un error relativo no superior a 0.08 y un nivel de significación
de 5%. Se sabe por un sondeo previo que aproximadamente el 60% de viviendas no tienen servicios básicos
Solución

Datos: N=1500; E=0.08; Z0.975=1.96; P=0.6;Q=0.4

Que sustituyendo en fórmula correspondiente, tenemos:

N Z20.975xPxQ 1500x1.962x0.6x0.4
n---------------------------------= ---------------------------------------=132
(N-1)xE2+ Z20.975xPxQ 1499x0.082+1.962x0.6x0.4

n= 132 viviendas
Ejercicios.
1. Se desea conocer el peso promedio de una determinada clase de
pescado con un error de estimación de 0´02 y con un nivel de
confianza del 99%. Por datos anteriores se sabe que el peso mínimo
es 1´48 libras y el máximo es de 2´47 libras.¿De qué tamaño debe
escoger la muestra? Suponga que los pesos de estos pescados se
distribuyen normalmente
2. Una máquina llena cajas con cierto cereal. El supervisor desea
conocer con un error de estimación de máximo 0´1 y un nivel de
confianza del 90%, una media estimada del peso. Como la varianza era
desconocida se procedió a escoger una muestra piloto. Los
resultados fueron los siguientes: 11´02, 11´14, 10´78, 11´59, 11´58, 11
´19, 11´71, 11´27, 10´93, 10´94. ¿Cuántas cajas debe escoger para que
se cumplan los requisitos propuestos?
3. Queremos ajustar una máquina de refrescos de modo que el promedio
del líquido dispensado quede dentro de cierto rango. La cantidad de
liquido vertido por la máquina sigue una distribución normal con
desviación estándar 0´15 decilitros. Deseamos que el valor estimado
que se vaya a obtener comparado con el verdadero no sea superior a
0´2 decilitros con una confianza del 95%.¿De qué tamaño debemos
escoger la muestra?
Muestreo Estratificado

 Este procedimiento de selección es el


indicado para poblaciones heterogéneas y
considera la variabilidad dentro de la
población para extraer una muestra más
precisa y eficiente que la que se obtendría
al aplicar directamente el muestreo
aleatorio simple.
 Restricción. Este procedimiento se debe
aplicar cuando es posible dividir la
población en estratos con gran variabilidad
entre estratos y pequeña variabilidad
dentro de ellos
Procedimiento de selección de la muestra
1º. La población de tamaño N se divide en L subgrupos
llamados estratos. Cuidando que la variabilidad entre
estratos sea grande y que sea pequeña la variabilidad
dentro de los estratos. La estratificación aumenta la
precisión de las estimaciones, haciendo que el error de
muestreo sea menor.
2º. De cada estrato se toma una muestra aleatoria de
tamaño nh .
3º. La suma de las muestras de los estratos conforman la
muestra total “n”.
4º. De la muestra de cada estrato se obtienen los diferentes
indicadores estadísticos. Estos valores, convenientemente
ponderados y sumados a los de los demás estratos, nos
permiten obtener los valores generales para la muestra
total.
 Para distribuir el tamaño de la muestra entre los L
estratos se utiliza la afijación
NOTACIONES
 El subíndice h indica el estrato y el subíndice i indica el elemento del
estrato.
 Para el estrato h tenemos las siguientes notaciones:
Nh: Total de elementos del estrato h
nh: Nº de elementos de la muestra (estrato h)
Wh=(Nh/N): Ponderación del estrato
fh= (nh/n): Fracción de muestreo del estrato
h2: Varianza del estrato
S2h: Varianza de la muestra del estrato h
Ph: Proporción de casos de interés en estrato h
Qh = 1-Ph
Tamaño de muestra para afijación
proporcional (Estimación de  )
 n: Tamaño de muestra
 Wh: Ponderación del estrato
 E: Error máximo tolerable
 Z: Coeficiente del (1-)% de confiabilidad
 h2: Varianza del estrato h.
Tamaño de muestra para afijación
optima (Estimación de  )
 n: Tamaño de muestra
 Wh: Ponderación del estrato
 E: Error máximo tolerable
 Z: Coeficiente del (1-)% de confiabilidad
 h2: Varianza del estrato h.
Tamaño de muestra para afijación
proporcional (Estimación de P )
 n: Tamaño de muestra
 Wh: Ponderación del estrato
 E: Error máximo tolerable
 Z: Coeficiente del (1-)% de confiabilidad
 Ph: Proporción de casos con caract. de interés en estrato h.
 Qh=1-Ph
Tamaño de muestra para afijación
óptima (Estimación de P )
 n: Tamaño de muestra
 Wh: Ponderación del estrato
 E: Error máximo tolerable
 Z: Coeficiente del (1-)% de confiabilidad
 Ph: Proporción de casos cn caract. de interés en estrato h.
 Qh=1-Ph
AFIJACION
 Se denomina afijación a la distribución del tamaño de la
muestra n entre los L estratos. Esto es, determinar los
valores de nh tal que verifique: n1 + n2 + ... +nL = n.
 Tipos de afijación.
 Afijación igual
 Cada valor de nh = n/L, es decir, la distribución no
tiene en cuenta ni el tamaño ni la variabilidad del estrato.
a. Afijación proporcional.
 Consiste en distribuir una cantidad de elementos en cada
estrato en forma proporcional al tamaño del estrato
respecto de la población.
 El tamaño de la muestra en cada estrato estará dado por:
 nh = (Nh/N)*n ;  h=1,2,…,L
AFIJACION OPTIMA. Estimación de µ
 La afijación óptima distribuye la muestra total (n) entre
los estratos, considerando simultáneamente el tamaño
(Nh) y el grado de variabilidad (h) del estrato.
 Fórmula para afijar óptimamente una muestra:
 Nh h
 nh = -----------* n;  h=1,2,…,L
  Nh h
 Si h no es conocida, puede ser reemplazada por el
valor muestral correspondiente: sh
AFIJACION OPTIMA. Estimación de P
 La afijación óptima distribuye la muestra total (n) entre
los estratos, considerando simultáneamente el tamaño
(Nh) y el grado de variabilidad del estrato.
 Fórmula para afijar óptimamente una muestra:

 Si Ph no es conocida, puede ser reemplazada por el


valor muestral correspondiente: ph
EJEMPLO
 Una población de 10000 elementos se ha
dividido en 3 estratos: N1= 3000, N2=2000,
N3=5000; siendo las varianzas de los estratos:
S21= 100, S22= 400, S23= 900
a. Calcular el tamaño de muestra estratificada
para estimar la media  con un error de 1.5 y
un nivel de confianza de 95%. Use la afijación
proporcional y la óptima.
c. Estimar el error de muestreo.(Error estándar
de la media muestral)
  𝑛h

0.3 * 873
0.2 * 873
0.5* 873

Afijación
proporcional
Solución Afijación óptima

Estrato Nh Wh S h2 W h h Nhσh nh
1 3000 0.3 100 3.00 30 112
2 2000 0.2 400 4.00 40 150
3 5000 0.5 900 15.00 150 561
Total 10000 22.00 220 823

a. Usando la fórmula adecuada:


2
 l

  Wh h  2
( 22 .0)
n  1 l  = 2  823
1.5 22.0
E 2  Wh h 2

1.96 10000
 1
Z2 N
Continúa solución:
b. Usando la fórmula correspondiente, se distribuye la muestra en los 3 estratos:
N h h
nh  L
* n;  h  1,...3 ; resultando: n1=112; n2=150; n3=561.
N 
1
h h

 h L
2
  h h  h h
( W  ) 2
N 
 1 1
c. Error de muestreo =  y   1 2 ;
n N N 
 
 
Que sustituyendo datos se tiene
MUESTREO SISTEMATICO
VENTAJAS Y DESVENTAJAS
Ejemplo. Selección de una muestra con salto sistemático
OBSERVACIÓN
MUESTREO POR CONGLOMERADOS
CONT. MAPC
VENTAJAS Y DESVENTAJAS
EJEMPLO

También podría gustarte