Está en la página 1de 36

MUESTREO CON R

Estadística Inferencial con R


Estadística Inferencial con R

Introducción
• La inferencia estadística o estadística inferencial es
una parte de la Estadística que comprende los
métodos y procedimientos para deducir propiedades
(hacer inferencias) de una población, a partir de una
pequeña parte de la misma (muestra).

• La bondad de estas deducciones se mide en términos


probabilísticos, es decir, toda inferencia se acompaña
de su probabilidad de acierto.

2
Estadística Inferencial con R

Introducción

• Se basa en las conclusiones a la que se llega por la ciencia


experimental basándose en información incompleta (de una
parte de la población).
• La inferencia estadística es una parte de la Estadística que
permite generar modelos probabilísticos a partir de un
conjunto de observaciones.
• Del conjunto de observaciones que van a ser analizadas, se
eligen aleatoriamente sólo unas cuantas, que es lo que se
denomina muestra, y a partir de dicha muestra se estiman los
parámetros del modelo, y se contrastan las hipótesis
establecidas, con el objeto de determinar si el modelo
probabilístico es el adecuado al problema real que se ha
planteado.
3
Estadística Inferencial con R

Utilidad de la Inferencia

• La utilidad de la inferencia estadística, consiste en


que si el modelo se considera adecuado, puede usarse
para la toma de decisiones o para la realización de
las previsiones convenientes.

4
Estadística Inferencial con R

INFERENCIA
POBLACIÓN

Muestra
Estadística Inferencial con R

Problemas fundamentales

• Los dos problemas fundamentales que estudia


la inferencia estadística son el "Problema de
la estimación" y el "Problema del contraste
de hipótesis"
Estadística Inferencial con R

Paramétrica y No paramétrica

• Cuando se conoce la forma funcional de la función de


distribución que sigue la variable aleatoria objeto de
estudio y sólo tenemos que estimar los parámetros
que la determinan, estamos en un problema de
inferencia estadística paramétrica
• Por el contrario cuando no se conoce la forma
funcional de la distribución que sigue la variable
aleatoria objeto de estudio, estamos ante un problema
de inferencia estadística no paramétrica.
Estadística Inferencial con R

Teorías en las que se basa

• En todos estos problemas que estudia la


inferencia estadística juega un papel
fundamental la "Teoría de la Probabilidad"
(distintas formas funcionales de las
distribuciones de probabilidad) y la "Teoría de
Muestras" (procedimientos para tomar
muestras de manera apropiada).
Estadística Inferencial con R

Teoría de Muestras

• Consideremos la población compuesta por los niños


ecuatorianos al nacer. Una característica medible de
los individuos de esta población es su peso; esta
característica depende de múltiples factores y se
puede considerar una variable aleatoria. La
distribución que sigue esta variable aleatoria es
normal, pero, ¿cuál es su media? y ¿cuál es su
desviación típica?.
Estadística Inferencial con R

Teoría de muestras

• Pues bien, la teoría de muestras estudia las


técnicas y procedimientos que debemos
emplear para que las muestras sean
representativas de la población que
pretendemos estudiar, de forma que los errores
en la determinación de los parámetros de la
población objeto de estudio sean mínimos.
Estadística Inferencial con R

Teoría de muestras

• Para que la extracción de la muestra sea representativa se


deben cumplir dos principios básicos:
1. Que haya independencia en la selección de los individuos
que forman la muestra
2. Que todos los individuos tengan la misma probabilidad de ser
incluidos en la muestra
• Para conseguir estos principios se emplean distintas técnicas
de muestreo. Consideremos dos modelos de muestreo básicos
Estadística Inferencial con R
Modelos de muestreo básicos
Muestreo Aleatorio Simple

• Para efectuar este tipo de muestreo en una población con N


individuos se siguen dos pasos:

• Numeramos de 1 a N los N individuos de la población.

• Mediante un programa de computador o una tabla de


generación de números aleatorios, seleccionamos a los n
individuos que formarán la muestra.
Estadística Inferencial con R
Modelos de muestreo básicos
Tipos de Muestreo Aleatorio Simple

MUESTREO ALEATORIO SIMPLE CON REPOSICIÓN


Se TOMA un elemento al azar, se ESTUDIA y se DEVUELVE
antes de extraer el siguiente.

• Todos los elementos tienen la misma probabilidad de ser


extraídos.
• Las extracciones son independientes.

Ejemplo en RCommander
x=1:10
sample(x, size=5, replace = TRUE)
Estadística Inferencial con R
Modelos de muestreo básicos
Tipos de Muestreo Aleatorio Simple

MUESTREO ALEATORIO SIMPLE SIN REPOSICIÓN

Se TOMA un elemento al azar, se ESTUDIA y NO se DEVUELVE


para futuras extracciones.

• NO todos los elementos tienen la misma probabilidad de ser


extraídos.
• Las extracciones NO son independientes.

x=1:10
sample(x, size=5, replace =FALSE)
Estadística Inferencial con R
Modelos de muestreo básicos
Muestreo Aleatorio Estratificado
• Cuando la población no es homogenea respecto a la variable aleatoria objeto de
estudio, para mejorar las estimaciones, conviene distinguir en ella, clases o estratos,
y proceder a lo que se llama un muestreo aleatorio estratificado.
• En este tipo de muestreo los estratos se deben elegir de manera que sean lo más
homogeneos posible respecto a la variable aleatoria a estudiar y que entre ellos
exista la mayor diferencia posible.

• Afijación: Es el reparto del tamaño de la muestra entre los diferentes estratos en


que hemos dividido la población.

• Afijación Uniforme : Consiste en tomar para la muestra el mismo número de


individuos por cada estrato.

• Afijación Proporcional : Consiste en distribuir los individuos que forman la


muestra proporcionalmente al número de individuos de cada estrato.

• Una vez determinado el número de individuos que deben pertenecer a cada estrato,
se procede a la selección de individuos de cada estrato por muestreo aleatorio
simple.
Estadística Inferencial con R
Modelos de muestreo básicos
Ejemplo práctico.

• En un Instituto de enseñanza secundaria en que


se ofertan los siguientes tipos de enseñanza :
• Ciclos de grado superior : 110 alumnos.
• Bachillerato : 162 alumnos.
• Ciclos de grado medio : 210 alumnos
• 2º ciclo de enseñanza secundaria obligatoria :
338 alumnos.
Estadística Inferencial con R
Modelos de muestreo básicos

• Se pretende valorar las faltas de ortografía que cometen los


alumnos del centro mediante una prueba-dictado de un texto
de 20 líneas; la prueba se pasará a una muestra de 50 alumnos,
para minimizar el costo en tiempo y medios. En esta situación
parece conveniente utilizar para la extracción de la muestra el
muestreo aleatorio estratificado con asignación proporcional.

• Dividimos la población en cuatro estratos : ciclos de grado


superior, ciclos de grado medio, bachillerato y 2º ciclo de
enseñanza secundaria obligatoria.
• Como el número total de alumnos son 820 y la muestra debe
estar formada por 50 alumnos, el cálculo del número de
alumnos que se han de tomar de cada estrato es:
Estadística Inferencial con R
Modelos de muestreo básicos

• Ciclos de grado superior :

• Bachillerato :

• Ciclos de grado medio :

• 2º ciclo de Enseñanza Secundaria Obligatoria


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones prácticas


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO SIMPLE

Si se desea cometer un error de estimación no mayor a do (e)


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO SIMPLE PARA LA MEDIA

(desviación típic a de 4.38178)


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO SIMPLE PARA LA MEDIA

sample.size.mean(e=2, S=4.38178, N=Inf, level=0.95)

sample.size.mean(e=2, S=4.38178, N=200, level=0.95)


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO SIMPLE PARA LA MEDIA
Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO SIMPLE PARA PROPORCIÓN
Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO SIMPLE PARA PROPORCIÓN

sample.size.prop(e=0.05, P=0.1, N=Inf, level=0.95)


sample.size.prop(e=0.05, P=0.1, N=2000, level=0.95)
Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO SIMPLE PARA PROPORCIÓN

Respuesta:
Para estimar la proporción de artículos electrónicos en el lote usando un diseño MAS con una
confianza de 95%y un error de estimación no mayor a 0.05 se debe elegir a lo menos 130
artículos del lote en la muestra.

Realizar 3 ejercicios de MAS del archivo pdf


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO ESTRATIFICADO
Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO ESTRATIFICADO

Si se desea cometer un error de estimación no mayor a do (e)


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO ESTRATIFICADO

Si se desea cometer un error de estimación no mayor a do (e)


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO ESTRATIFICADO
Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO ESTRATIFICADO

stratasize(e=2, Nh=c(155,62,93), Sh=c(5,15,10), type=“prop”)

stratasamp(n=67, Nh=c(155,62,93), Sh=c(5,15,10), type=“prop”)


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO ESTRATIFICADO

a) i) Para estimar la talla media de los salmones en el cultivo usando


un diseño MAE con asignación proporcional con una confianza de
95%y un error de estimación no mayor a 2 centímetros se debe
elegir a lo menos 67 salmones en la muestra de los cuales 34 deben
ser elegidos del estanque 1, 13 del estanque 2 y 20 del estanque 3
Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO ESTRATIFICADO

stratasize(e=2, Nh=c(155,62,93), Sh=c(5,15,10), type=“opt”)

stratasamp(n=67, Nh=c(155,62,93), Sh=c(5,15,10), type=“opt”)


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO ESTRATIFICADO

a) ii) Para estimar la talla media de los salmones en el cultivo usando un


diseño MAE con asignación óptima con una confianza de 95%y un
error de estimación no mayor a 2 centímetros se debe elegir a lo
menos 56 salmones en la muestra de los cuales 16 deben ser elegidos
del estanque 1, 20 del estanque 2 y 20 del estanque 3
Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO ESTRATIFICADO PARA PROPORCIÓN

sqrt(0.8*0.2) #0.4
sqrt(0.25*0.75) #0.4330127
sqrt(0.5*0.5) #0.5

stratasize(e=0.05, Nh=c(155,62,93), Sh=c(0.4, 0.4330127, 0.5)) #Tamaño de muestra n

stratasamp(n=153, Nh=c(155,62,93), Sh=c(0.4, 0.4330127, 0.5), type=“prop”)


Estadística Inferencial con R

Modelos de muestreo básicos: Aplicaciones


MUESTREO ALEATORIO ESTRATIFICADO PARA PROPORCIÓN

Para estimar la proporción de salmones que cumplen la norma para


el consumo en el cultivo, usando un diseño MAE con asignación
proporcional con una confianza de 95% y un error de estimación no
mayor a 0.05 se debe elegir a lo menos 153 salmones en la muestra
de los cuales 76 deben ser elegidos del estanque 1, 31 del estanque
2 y 46 del estanque 3
Realizar 3 ejercicios de MAE del archivo pdf

También podría gustarte