Está en la página 1de 18

ESTADÍSTICA II

MUESTREO

Nuestro objetivo es usar la información de la muestra para generalizar y llegar a conclusiones


acerca de la población de interés.
Recordemos algunas definiciones:
Parámetro es una medida de resumen numérica que se calcularía usando todas las unidades de
la población. Es un número fijo. Generalmente no lo conocemos.
Estadístico Es una medida de resumen numérica que se calcula de las unidades de la muestra.
El valor de la estadística se conoce cuando tomamos una muestra, pero varía de muestra en muestra
(variación muestral)
Inferencia estadística: es el proceso de sacar conclusiones acerca de la población basados en la
información de una muestra de esa población.

Población
Parámetro
Inferencia
Muestra
Homogénea Representativa y Probabilística Procesos Matemáticos
ho
Estadístico

Objetivos de la inferencia: mediante la inferencia estadística podemos estimar parámetros,


intervalos de confianza, prueba o test de hipótesis (o prueba de significación estadística)

Supongamos que se conocen las estaturas de todos los individuos de una población. Una
medida que describa la posición central de esta población sería el promedio de todas las estaturas
esto se representa por el parámetro μ.
Si sólo tuviéramos información sobre las estaturas de una muestra extraída de esta población, el
promedio x́ calculado en la muestra sería la estadística correspondiente.
Si nos interesa la dispersión de los valores individuales de las estaturas, calcularíamos la desviación
estándar, que para la población se simbolizará por  y para la muestra por S.

La estimación de parámetros consiste en el cálculo de estadísticos en muestras, con el fin de


obtener información sobre el valor de los parámetros de la población. Esta inducción se basa en la
teoría de probabilidades y sólo es posible cuando se conoce la conducta o "distribución muestral"
de las estadísticas.

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 1


ESTADÍSTICA II

La docimasia de hipótesis consiste en conocer la probabilidad de ocurrencia, bajo la hipótesis nula,


del resultado obtenido en la investigación, basándose en la distribución muestral de la estadística
utilizada para medir tal resultado.

SESGO Y PRECISIÓN
Cuando estimamos un parámetro de la población a partir de una estadística muestral, nos va a
interesar que la estimación no tenga sesgo y sea precisa.

La figura adjunta ilustra la diferencia entre sesgo y precisión. El gráfico de la izquierda arriba
muestra una estadística precisa pero sesgada. El gráfico a la derecha arriba muestra una
estadística insesgada, pero imprecisa. El gráfico de la izquierda abajo muestra una estadística
sesgada e imprecisa. Por último, el gráfico de la derecha abajo muestra una estadística insesgada
y precisa.

TAMAÑO DE LA MUESTRA
El tamaño de la muestra, es un tema que siempre preocupa, no tiene fácil solución y va
estrechamente unido a la representatividad. En principio hay que rechazar la idea, demasiado
extendida, de que la muestra debe ser proporcional a la población. De hecho, a medida que
aumenta ésta, con una menor proporción podemos alcanzar la representatividad. No obstante, en
igualdad de otras condiciones, los estadísticos calculados con muestras grandes son más
precisos que los calculados con muestras pequeñas, pero una muestra representativa de 50
elementos es preferible a otra no representativa de 100 (Jiménez Fernández, 1983).

No existe un tamaño ideal de la muestra. A efectos descriptivos, se considera una


muestra grande cuando n > 30. Una muestra debe ser lo suficientemente grande como para ser
representativa, pero el número de elementos necesarios para lograr la representatividad varía de
una investigación a otra. Cuanto más homogénea es una población en la/s característica/s objeto
de estudio, más fácil resulta obtener muestras representativas sin necesidad de que sean grandes.
Es decir, el tamaño de la muestra está en relación directa con la desviación típica de las
puntuaciones en la/s características de la variable a investigar.

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 2


ESTADÍSTICA II

El tamaño de la muestra viene condicionado por el tanto por ciento de la característica


que estamos estudiando. Cuando no se conoce es conveniente hacer algún pequeño estudio
inicial con una muestra mucho menor para tener alguna idea de ese porcentaje. Por ejemplo,
alumnos que se matriculan en los programas de formación y después no asisten o abandonan.
Cuando tenemos una proporción de la característica del 50% estamos ante lo que se designa
como ‘el caso más desfavorable’ porque exige la muestra mayor. Si no conocemos la
proporción se asigna el 50% como la opción más segura en los cálculos de la muestra.

El tipo de datos que se desea recoger y el medio que para ello se va a emplear son
condicionantes que influyen en la menor o mayor reducción de la muestra seleccionada. No es
igual seleccionar, por ejemplo, aulas ya organizadas y recoger la información en días y horas
lectivos que hacerlo a través de un cuestionario enviado por correo.

El tamaño de la muestra también depende del tipo de muestreo que se ha llevado a cabo.
Por ejemplo, en las muestras estratificadas, el error es menor que en las no estratificadas, y
también lo es el tamaño de la muestra necesario.

El tamaño de la muestra puede dilucidarse en parte preguntándose por la cuantía del


error que es probable cometer al calcular diversos estadísticos partiendo de muestras de
diferente tamaño. Se considera clásica la curva de error de Kerlinger (1975) en la que el error
aumenta a medida que disminuye el tamaño de la muestra y a la inversa, entendiendo por
error la desviación con respecto a los parámetros de la población. Consecuentemente este
autor recomienda usar muestras grandes, no porque sean buenas en sí mismas sino para dar al
principio de distribución al azar una probabilidad de “actuar”. Así, por ejemplo, seleccionada al
azar una muestra de personas es más fácil, a medida que aumenta el número de personas de la
muestra, que el porcentaje de mujeres y de hombres se equilibre.

El nivel de confianza que queramos que alcancen nuestros resultados también influye
en el tamaño que debamos dar a la muestra. Entre +2 y -2 sigmas de la curva de distribución
normal de Gauss, a partir de la media, está incluido el 95.5% de la población. Esto quiere decir
que tenemos una probabilidad de que 955/1000 coincidan con los de la población total. Si
queremos alcanzar una mayor certidumbre hemos de abarcar entre +3 y -3 sigmas, en cuyo caso
el riesgo de que exista diferencia entre los estadísticos de la muestra y los parámetros de la
población sean distintos será de 997/100, pero naturalmente tendremos que elevar el numero de
elementos de la muestra. Para determinar el volumen de la muestra, de acuerdo con el nivel de
confianza

Otro dato determinante del tamaño de la muestra es el error de estimación. Es lógico


pensar que no haya una coincidencia total entre los datos de la población y los de la muestra.

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 3


ESTADÍSTICA II

Hemos de indicar el máximo error tolerable, que suele establecerse en el 5%. Pero si queremos
rebajar ese error tendremos que aumentar el volumen de la muestra.

Concluimos que determinar el tamaño de la muestra es un tema complejo. Por tanto, el


investigador habrá de tener en cuenta: la amplitud del universo (infinito o no), representatividad,
las variables (tipo de datos, valores de la misma, homogeneidad/variabilidad de los datos), el
tipo de muestreo, el proceso y medios de recogida de datos, los análisis estadísticos que se
planifiquen, el error muestral, el error de estimación y el nivel de confianza con el que
deseemos trabajar entre otras consideraciones. Con esta base se tendrán los referentes necesarios
para determinar el tamaño de la muestra.

TEORÍA DE MUESTRO

I. Completar las siguientes definiciones

El objetivo de la estadística es encontrar….ESTADÍSTICOS.. que son obtenidos a partir de una

…MUESTRA……….y esta a la vez tiene que ser ……HOMOGENEA….. y

….REPRESENTATIVA……. para que sus resultados puedan ser……

GENERALIZADOS,INFERIDOS….. a una determinada población.

II. Completar :

a) Mediante la inferencia estadística podemos encontrar:

- ANOVA
- INTERVALOS DE CONFIANZA
- PRUEBA O TEST DE HIPÓTESIS
b) Indicar que factores intervienen para determinar el tamaño de la muestra.

 NIVEL DE CONFIANZA

 ERROR DE ESTIMACIÓN

 TIPO DE MUESTREO

 POBLACIÓN-TIPO DE DATOS

 DESVIACIÓN ESTÁNDAR

c) El nivel de confianza determina el grado de certidumbre que nuestros resultados

obtenidos en la estimación coincidan con los de la población total y esta dado

generalmente por el …95%.

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 4


ESTADÍSTICA II

d) El error de estimación es nos indiaca la probabilidad de que nuestros resultados no

coincidan con los de población y esta dado generalmente por el…5%……

III. Indicar porque es importante(beneficios) utilizar una muestra para realizar un

trabajo de investigación

 RESULTADOS MAS PRECISOS

 MENOR TIEMPO

 MENOS COSTO

 REDUCE EL PERSONAL

IV. Indicar el valor de verdad de los siguientes enunciados

a) La inferencia estadística es un proceso que se realiza de una muestra hacia una

población. (V)

b) Cuando obtenemos una muestra esta debe ser homogénea para obtener

resultados más precisos. (V)

c) El tamaño de la muestra se considera grande cuando n > 30 (V)

Si no conocemos la proporción muestral esta se estima en 50(F)

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 5


ESTADÍSTICA II

TÉCNICAS DE MUESTREO

Aunque no existe una única forma de clasificar las técnicas de muestreo, es frecuente
clasificarlas en no probabilísticas y probabilísticas.

MUESTREO NO PROBABILÍSTICO
Estos métodos de selección de muestras dependen exclusivamente del juicio del investigador no
teniendo base científica y por consiguiente no es base para la inferencia estadística, salvo
algunas excepciones, algunos métodos no probabilísticos son:
A. Muestreo Intencional: Es aquella en la que las unidades que componen la
muestra son escogidas por el investigador por Ejemplo: Si se desea conocer
algunas actitudes relevantes de una comunidad la entrevista se hace a personas
que conocen toda la comunidad, como pueden ser las personas ancianas,
gobernador, representante de salud, de educación, etc.
B. Muestreo sin norma: Es una muestra tomada sin criterio del investigador se
justifica solo cuando la población es homogénea.
C. Muestreo accidental: Es la selección de las muestras en estudios de casos raros
o esporádicos.
D. Muestreo de voluntarios: Este muestreo es bastante usado en los ensayos
clínicos para probar nuevos medicamentos.
E. Muestreo por acceso más fácil : Es aquella en la que las unidades son
escogidas por estar en mejores condiciones de accesibilidad.

MUESTREO PROBABILÍSTICO.

Conocido también como muestreo de selección aleatoria, utiliza el azar como instrumento de
selección, pudiéndose calcular de antemano la probabilidad de que cada elemento sea incluido
en la muestra. El muestreo por azar o probabilístico presenta varias modalidades:

1. MUESTREO ALEATORIO SIMPLE.


Es la modalidad de muestreo más conocida y que alcanza mayor rigor científico. Garantiza la
equiprobabilidad de elección de cualquier elemento y la independencia de selección de
cualquier otro. En este procedimiento se extraen al azar un número determinado de
elementos, ‘n’, del conjunto mayor ‘N’ o población, procediendo según la siguiente
secuencia:
- Definir la población, confeccionar una lista de todos los elementos,
asignándoles números consecutivos desde 1 hasta N.
- La unidad de base de la muestra debe ser la misma.
- Definir el tamaño de la muestra

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 6


ESTADÍSTICA II

- Extraer al azar los elementos.


La muestra quedará formada por los ‘n’ elementos obtenidos mediante sorteo de la
población utilizando la tabla de números aleatorios.

Ejemplo: En una localidad de 740 familias, se desea realizar un estudio para determinar
el nivel de pobreza. Seleccione un tamaño de muestra de 20 familias para dicho estudio.

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 7


ESTADÍSTICA II

TAMAÑO DE MUESTRA
El tamaño de la muestra, es un tema que siempre preocupa, no tiene fácil solución y va
estrechamente unido a la representatividad. En principio hay que rechazar la idea, que la
muestra debe ser proporcional a la población. Para calcular el tamaño de la muestra se debe
tener en cuenta tres factores:
- El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra
hacia la población.
- El porcentaje de error que se pretende aceptar al momento de hacer la generalización
- El nivel de variabilidad que se calcula para comprobar la hipótesis.

TAMAÑO DE MUESTRA PARA ESTIMAR 𝛍

Si se quiere estimar 𝛍, con precisión, e(error)es fijada por el investigador, el tamaño de la


muestra necesario se determina del intervalo de confianza para media tanto para una población
finita como infinita.

Determinar el tamaño de muestra:

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 8


ESTADÍSTICA II

En resumen:

Z 20 ∙ N ∙ σ 2
n= 2 2 2
Poblacion finita.
Z 0 ∙ σ +(N−1)∙ e

Z 20 ∙ σ 2
n= 2 Poblacion infinita
e

Donde:

σ 2 : Es la varianza poblacional. (En la practica σ 2 es estimado por S2 a partir de una encuesta


anterior o de una muestra piloto.

Z 0 : Se calcula utilizando el nivel de confianza, si esta es 95% entonces Z 0=1.96

e : Porcentaje de error.

1. Un investigador desea traer una encuesta en un gran sector para determinar su ingreso
familiar promedio de los 30000 hogares. El investigador observa que el valor del
estimador de la media se encuentre a 3000 de la media verdadera con un nivel de
confiabilidad del 99%. Se utiliza una desviacion estándar muestral igual a 20000 que se
obtuvo en una encuesta anterior como estimador de la desviacion estándar de la
poblacion.¿Que tamaño debe ser ña muestra que se investiga?

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 9


ESTADÍSTICA II

TAMAÑO DE MUESTRA PARA ESTIMAR p

De manera similar, la fórmula del tamaño de muestra n para la estimación de p con un error
máximo de e y un nivel de confianza dado es:

Determinar el tamaño de muestra:

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 10


ESTADÍSTICA II

En resumen:

Z 20 ∙ N ∙ p ∙(1− p)
n= 2 Poblacion finita .
Z 0 ∙ p ∙(1− p)+( N −1)∙ e2

Z 20 ∙ p ∙(1− p)
n= Poblacioninfinita
e2

En el caso de que el valor de p sea desconocido, se debe sustituir por 0.5 o estimado
preliminarmente de una muestra anterior, o de una muestra piloto.

2. El director del colegio Belén desea calcular la proposición de los 1000 alumnos del
último año que piensan seguir estudios en la universidad ¿Qué tamaño debe tener la
muestra que necesita tomar el director si su estimado debe estar a 0.04 del valor
verdadero con 99% de confianza? ¿El año anterior el 70% de los alumnos encuestados
dijeron que tienen planeado seguir estudios en la universidad?

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 11


ESTADÍSTICA II

3. La oficina de planificación familiar de cierto distrito desea determinar la proposición de


familias con un ingreso mensual inferior del S/. 30000. Estudios previos han indicado
que esta proporción era del 20%.
a. Qué tamaño muestral se requiere para asegurar con confianza del 0.95 que el
error en esta estimado en la proporción no sobrepasara a 0.05.
b. En qué forma variara el tamaño muestral requerido si el máximo error
permitible es reducido a 0.01.

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 12


ESTADÍSTICA II

2. MUESTREO ALEATORIO SISTEMÁTICO.


El empleo de muestras sistemáticas consiste en una variante del anterior tipo de muestreo.

N
- Se calcula ‘I’ (aproximando a un numero entero) mediante la fórmula I =
n
- Se elige un número de arranque “a” (aleatoriamente) menor o igual que I, es decir, que
cumpla la condición: 1 < a < I.
- Por último la muestra estará conformada por los números que serán:
a , a+ I , a+2 I , a+3 I , ⋯ , etc .

Ejemplo: En un barrio hay 740 familias, se desea realizar un estudio para determinar el
nivel de pobreza. Seleccione un tamaño de muestra de 20 familias para dicho estudio.

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 13


ESTADÍSTICA II

3. MUESTREO ESTRATIFICADO.
Este muestreo se utiliza cuando la población está constituida en estratos o conjuntos de la
población homogéneos con respecto a la característica que se estudia. Dentro de cada estrato
se puede aplicar el muestreo aleatorio o sistemático. Consiste en subdividir la población en
subgrupos o estratos con arreglo a la/s característica/s que se consideren y en elegir la
muestra de modo que estén representados los diferentes estratos. Para la obtención de la
muestra estratificada se siguen los siguientes pasos:

- se divide la población en estratos.


- de cada estrato se extrae una muestra por algún procedimiento de muestreo.
- el número de individuos de cada estrato se puede decidir por paridad o
proporcionalidad.
- la suma de las muestras de cada estrato forman la muestra total ‘n’
Dentro del muestreo estratificado suele distinguirse:

Muestreo estratificado constante. La muestra se obtiene seleccionando un número igual de


individuos de cada estrato en que se ha dividido la población, con independencia del tamaño y
variabilidad de los mismos dentro de la población. Es decir

n
ni = con i:1,2 , … , k estratos
k

M. Estratificado proporcional. En este caso se selecciona de cada estrato un número de


elementos proporcional a su tamaño en el conjunto de la población.
Es decir:

Ni
ni =n ( )
N
con i:1,2 , … , k estratos

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 14


ESTADÍSTICA II

PRACTICA
1. Una empresa con 1558 trabajadores desea realizar una encuesta para medir el clima laboral,
la encuesta se debe aplicar a 15 trabajadores. ¿Qué trabajadores pertenecen a la muestra?
a) Utilizando muestreo aleatorio simple
b) Utilizando muestreo sistemático.

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 15


ESTADÍSTICA II

2. Se desea realizar un estudio para medir la calidad que tiene el servicio de limpieza pública
por distrito. La muestra es de 80 personas determinar el tamaño de muestra por estrato
utilizando la siguiente información:

Distrito Población
Wanchaq 1385
Cusco 4255
Santiago 2143

a) Por afijación constante. (Indicar a las casas seleccionadas por muestreo aleatorio
simple)
b) Por afijación proporcional. (Indicar a las casas seleccionadas por muestreo
sistemático)

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 16


ESTADÍSTICA II

3. El gerente de sucursal de una cadena de librerías en todo el país desea estudiar las
características de los clientes de su tienda localizada cerca de la Universidad. En
particular, decide observar la cantidad de dinero que gastan los clientes al comprar CD
educativos relacionados con cursos como estadística, contabilidad o cálculo.
a) Si en el último mes la librería obtuvo 350 clientes. Que tamaño de muestra se necesita
si se desea el 98% de confianza al estimar la cantidad media gastada por la población
con un error máximo de 4 dólares y se supone que la desviación estándar es de 10
dólares.

b) Si el gerente enumera a los clientes por el orden en que ingresan a la librería, indicar a
quienes considera en la muestra.
- Por muestreo aleatorio simple utilice tabla de números aleatorios
- Por muestreo sistemático.

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 17


ESTADÍSTICA II

4. Se va a estimar una proporción de empresas que no están al día en sus pagos con SUNAT
a) Que tamaño de muestra se debería seleccionar si se quiere tener una confianza del 99%
de que el error de estimación de la proporción de empresas que no están al día en sus
pagos no debe ser superior al 5%
b) Si SUNAT tiene identificado a estas empresas y va realizar una inspección, que tamaño
de muestra debería seleccionar de una población de 3700 empresas, si se quiere tener
una confianza del 95% de que el error de estimación no sea superior al 10%.
c) Indicar cuales serian las 15 primeras empresas seleccionadas utilizando muestreo
sistemático.

Jessica Elizabeth Chalco Suá rez – Wilbert Colque Candia 18