Está en la página 1de 43

UNAM – ENTS - SUAyED

Materia: Estadística Aplicada a la


Investigación Social I y II,
Muestreo material complementario al de la
plataforma

Elaborado por Maestro en Sistemas


Carlos Payno Sánchez,
Abril 2013, 2014 (Actualización 2020)
En la literatura hay varias metodologías

Para calcular el tamaño de la muestra.

El objetivo del muestreo es permitir que con pocos


datos, podamos obtener las características de
toda la población que estamos estudiando,
“generalizar”. Y también permite agilizar la
investigación porque los costos que implicaría
preguntar uno por uno son muy altos en tiempo
o en costo.

Carlos Payno Sánchez, 2020


¿Cuales son los pasos
que lleva una investigación
Social que lleva estadística?
Veamos mas detalle en cada paso

Carlos Payno Sánchez, 2020


Definir el tema “ EL QUE “

El qué se refiere a la definición del tema de


investigación que lleva implícito de
manera obvia a el “quiénes”, el “Dónde” y
el cuándo, y no tan obvia “el cuántos”
que es el tema del muestreo.
Algunos creen “erróneamente” que el
tamaño de la muestra debe ser
proporcio-nal al tamaño de la población.
Pero no es necesario.

Carlos Payno Sánchez, 2020


Dentro de los pasos de una investigación

Social en dónde nos apoyamos en la


estadística, para obtener los datos,
usamos el cálculo del tamaño de la
muestra así que de los doce puntos que
se tienen que cubrir con la metodología
del Maestro Carlos Payno, nos
referiremos solamente al “Cuántos”
Apuntes desarrollados para el Curso Intersemestral:
Estudio de caso estadístico sobre Violencia de Género
ENTS, Payno, C, 2012
Muestreo

Carlos Payno Sánchez, 2020


Si por ejemplo. Si nos encargan evaluar a los
Trabajadores de una empresa, no hacemos
muestreo, (a menos que la empresa tenga miles
de empleados) los evaluamos a todos.
En la práctica se ha encontrado que muchas
poblaciones se comportan normalmente, eso
se demuestra con la ley de los grandes números
e investigaciones que hizo Gauss y que
comprobó Galton con su máquina de canicas.
Y que no es necesario que sea proporcional,
porque entre más grande sea la población
mayor será su homogeneidad y menor será su
tamaño de muestra.
Carlos Payno Sánchez, 2020
Si somos pocos, encontramos muchas
diferencias, pero si el grupo crece suficiente
Encontraremos, pocas similitudes entre los
miembros, y de esta característica se sirve el
muestreo, implica que requeriremos mas
sujetos.
Sin explicar todavía las formulas. Encontramos
que para poblaciones de 15,000 habitantes una
muestra representativa, confiable y consistente
no pasa de 700 casos (4.5 %)
Pero para una población de 1,500 necesitaremos
316 casos (21 %)
Carlos Payno Sánchez, 2020
Las fórmulas para calcular los tamaños de
muestras, para población infinita, y finitas:

Las fórmulas son


Población Infinita y Población Finita

A esta formula en la literatura la encontramos como Tamaño de Muestra


Para estimar Proporciones
Para meterlas a la hoja de cálculo o en una
calculadora manual.
Para calcular del tamaño de la muestra para
datos globales con población infinita:
n = ( (Z*Z) *p*q) / (e*e )

Para el cálculo del tamaño de la muestra


para datos globales con población finita:
n = ( (Z*Z) * N*p*q) / ( (e*e * (N-1) )+( (Z*Z) * p*q))
N: es el tamaño de la población o universo (número
total de posibles encuestados).

Z: Es una constante que depende del nivel de


confianza o certidumbre que asignemos. El nivel
de confianza indica la probabilidad de que los
resultados de nuestra investigación sean ciertos: un
95 % de confianza es lo mismo que decir que nos
podemos equivocar con una probabilidad del 5%.

Carlos Payno Sánchez, 2020


Niveles de confianza y valores de Z más utilizados

• Si pretendemos obtener un nivel de confianza del


95% tendremos que usar z = 1.96
• e: Error muestral deseado. Es la diferencia que
puede haber entre el resultado que obtenemos
preguntando a una muestra de la población y el
que obtendríamos si preguntáramos al total de
ella.

Carlos Payno Sánchez, 2020


Algunos autores en lugar de hablar del intervalo de
confianza usan el nivel de significancia.
Ejemplo para un intervalo de confianza de 95% le
corresponde un nivel de significancia del 5% ambos
suman 100%
Otros autores se refieren a los errores muéstrales como
precisión.
Determinar el Tamaño de la Muestra “n”
Hay varios factores que son necesarios para
determinar el tamaño de una muestra “n” :
• El nivel de confianza “Z”
• El margen de error “e”
• La variabilidad de la proporción de elementos
de la población que tiene una característica en
estudio “p”
• El complemento de p, llamado “q” es igual a “q=
1 - p”. En porcentajes es “q%=100%-p%”
• El tamaño de la Población “N”

Carlos Payno Sánchez, 2020


Recomendamos trabajar con porcentajes

El margen de error “e%”, la variabilidad de


la proporción de elementos “p%” y su
complemento “q%” deberán ser
expresados en porcentajes
• “e=5%”, y no “e = 0.05”,
• “p=70%” y no “p=0.7” y su complemento
• “q=30%” y no “q=0.3”, esto facilita los
cálculos
Dado que los alumnos comenten mas errores al usar decimales,
que cifras enteras
Cuando el intervalo de confianza vale 70%,
la Z asociada vale 1.04

Muchos autores en internet dice que vale


Z=1 “ERROR” cuando el intervalo de
confianza es 70%.
Si queremos que Z valga “1”; el intervalo de
confianza sera de 68.26%

Carlos Payno Sánchez, 2013


Ejemplo
Piden que calculemos una
Muestra para una Población de 2738 Habitantes,
con un Intervalo de confianza del 90%, un error del
5%, desconocemos p y q, entonces valdrán 50.
Para este intervalo Z vale 1.65, sustituimos en la
formula
2738 (50) (50) (1.65)^2 18635512.5
n= =
(5)^2 (2737) +(50)(50)(1.65)^2 68425 + 6806.25

n = 247.7 se sube a 248 encuestas


Población N = 2738 Habitantes,
Muestra n = 248
Porcentaje =248*100 / 2738 = 9%,

Este intervalo de confianza (90%) implica que tomaremos


en cuenta a 9 de cada 10 habitantes, eso se denomina
certeza o certidumbre. Si le preguntas a 9 de cada 10 es
menos probable que te equivoques.

Si en cambio seleccionamos el intervalo de 70% ,


estaríamos dejando fuera a 3 de cada 10, pero la
muestra seria muy pequeña, De tan solo 97,
representando un 4% del total de la población
Tabla en excel, para calcular los tamaños de las
muestras, con diferentes intervalos de confianza
Población FINITA
Tabla en excel, para calcular los tamaños de las
muestras, con diferentes intervalos de confianza

Población INFINITA

Carlos Payno Sánchez, 2020


Usos de los intervalos de confianza

I. de Confianza. USOS
70 a 75% Sondeos, estudios preeliminares, votos
Estudios piloto, exploratorios, conteos
rápidos, de índole social
80 a 85% Estudios correlacionales, de índole
social, estudios de mercado
90% Estudios Descriptivos, de índole
social, (medicina, biologia, psicología)
Usos de los intervalos de confianza

I. de Confianza. USOS
95 a 95.5% Estudios formales Descriptivos y
Explicativos, de índole social y científico
99% Estudios Explicativos, de índole formal en lo
social o en cualquier ámbito en dónde se
requiera muy alta certeza de los resultados.
Como en el caso de un estudio epidemiológico o
cualquiera en donde no quepa ninguna duda.
Los autores que usan la metodología en donde el
intervalo de confianza es del 68.26% (Z =1)
Condenan a los estudiantes a quedarse en el nivel
Exploratorio y ello puede acarrear que sus
investigaciones formales se queden en ese nivel, en
lugar de ser correlacionales
Una recomendación a los Alumn@s, es que

Hagan estas tablas en excel, pero con p = q =


50%, para Poblaciones Finitas e Infinitas.

Con la ventaja de que estando en excel, ustedes


pueden con sólo cambiar un dato encontrar el
tamaño de la muestra para un intervalo dado.

Carlos Payno Sánchez, Oct. 2012


Ejemplo 1

En un estudio, se desea determinar en que proporción los


niños de la región del Chamizal comen Proteínas en el
desayuno. (Proteínas = Leche, carne, huevos, queso, frijoles, etc)
Si se sabe que en la región existen 1,500 niños y
deseamos tener una precisión del 10 por ciento (nuestro
margen de error será 10 por ciento), y nos piden que el
estudio tenga un nivel de significancia del 5% (intervalo de
confianza del 95% entonces Z vale 1.96)

¿De qué tamaño tiene que ser la muestra?

Recuerda que cuando desconocemos la proporción "p“


asumimos la varianza más grande es decir 0.5=50%
Antes de dar el clic para continuar trata de resolverlo
El error lógico recomendable es del
Solución Ej. 1 e=5%, para evitar tener muestras
poco significativas.

Datos N=1,500 niños, e=10%, Z = 1.96


Se asume la varianza máxima p=50%

¿Cuánto crecerá el tamaño de la muestra si


disminuimos el error de 10% a 5%?
Si Error 10% muestra 91 casos, Si el Error 5% muestra de 306
Niños =?

= 306 niños

Si consideramos ahora un error de 1 %


El Tamaño de la muestra crece a 1,297
Veamos otros ejemplos
Adolecentes =?
En una población de 1176 adolescentes de una Ciudad
Patzcuaro se desea conocer el grado de aceptación de
los programas de planificación familiar que ha hecho el
IMUJER

Para ello se desea hacer un muestreo por lo que se


necesita saber el total de la muestra de jóvenes a
entrevistar, para tener una información adecuada con un
error éstandar del 5% con un intervalo de confianza del
90%

Si el error es 5% puede escribirse 0.05 en decimales.


¿?
Puedes decir si el tamaño de la muestra es
verdadero
(a) 30 casos
(b) 117 casos
( c) 221 casos
(d) 847 casos
…………………….. Respuesta correcta
c
¿Qué sucede cuando tenemos una
población desconocida?
Imagina que te pido que calcules un tamaño de muestra de
los niños de la República Mexicana que conforman las
edades menores a 14 años.
Para saber el efecto de la campaña de vacunación del DIF
en el área de Estado de México y Michoacán. Sabemos
por estudios previos que la población menor a 14 años
del Estado es un 15% de la población del país, y la de
Michoacán es el 7.8%.
Se te pide que el muestreo tenga un error del 5% con un
intervalo de confianza del 95.5%, se desconoce la
variabilidad (p=?)
Para 2020 la población de México se estima en 130
millones de habitantes

Entonces los niños con edades menores a 14 años.


Estado México es un 15% de la población del país, y la de
Michoacán es el 7.8%.
Entonces son
13,000,000*0.150 =1,950,000
13,000,000*0.078 =1,014,000
Suman un total de 2,964,000
La población del Edo. Mex es 15% y Michoacán es el 7.8%

Tenemos los datos: e=5% y Z = 2.005 ( I de C


95.5%)
Entonces usamos la formula de población infinita,
dado que sabemos por haber leído que México
tiene más de 130 millones de Habitantes y la
mitad son menores
Ahora sacamos los estratos correspondientes
Muestra total para toda la República = 402

Para el Estado de México = 402 x 0.150 = 61


Para el Estado de Michoacán = 402 x 0.078 = 32
Para el Resto de la República = 402 x 0.772 = 311
Si los sumamos nos da la muestra = 404
Si no usamos estratos tendriamos que sacar 402 encuestas para ambos
estados de la República Méxicana, en lugar de 61 y 32, la diferencia entre
402 y 404 es que se redondea hacia arriba los decimales en cada estrato.

Recuerda que 15% es lo mismo que 15/100 = 0.150


Y que 7.8% serán 7.8/100 = 0.078
Ahora si quieres practicar comprueba los tamaños de las
muestras siguientes
¿Qué pasa si no usamos la formula de
población infinita?
Imagina que te pido que calcules un tamaño de muestra de
los niños de la República Mexicana que conforman las
edades menores a 14 años.
Para saber el efecto de la campaña de vacunación del DIF
en el área de Estado de México y Michoacán. Sabemos
por estudios previos que la población menor a 14 años del
Estado es un 15% de la población del país, y la de
Michoacán es el 7.8%.
Se te pide que el muestreo tenga un error del 5% con un
intervalo de confianza del 95.5%, se desconoce la
variabilidad (p=?)
Tenemos: e=5% y Z = 2.005 ( I de C 95.5%)
Usamos la formula de población, sabemos por haber
leído que México tiene más de 130 millones de
Habitantes y la mitad son menores a 14 años.
Entonces 130 / 2 = 65 millones
Tenemos: e=5% y Z = 2.005 ( I de C 95.5%)
Usamos la formula de población, sabemos por haber
leído que México tiene más de 130 millones de
Habitantes y la mitad son menores a 14 años.
Entonces 130 / 2 = 65 millones
Estarás sorprendido ¡Verdad!

Cuando tenemos poblaciones muy grandes,


no calculamos con la fórmula de población
finita, usamos la de población infinita
(cosa que es mas sencilla), la experiencia
nos indica que los resultados son los
mismos,
¿Podrías calcular en que valor de Población
“N” se comportan igual los tamaños de la
muestra?
Comprobar el tamaño de la muestra es: 306
N = 350 habitantes “Población”
con un intervalo de confianza del 70% con un
error del 5% y
p = q = 50%, el tamaño de la muestra es de

Con la ventaja de que estando en excel, ustedes


pueden con sólo cambiar un dato encontrar el
tamaño de la muestra para un intervalo dado.

Carlos Payno Sánchez, 2013


Formula en excel

=Redondear.mas(A3*C3*C3*D3*E3)7(((A3-1)*(F3*F3)+)(C3*C3*D3*E3)),0)

Celda que muestra el resultado de la formula


Carlos Payno Sánchez, 2013
Comprobar los tamaños de las muestras

Intervalo de confianza del 95.0% ( Z = 1.96 )


error del 5% y p = q = 50%
Población N Muestra ”n” Porcentaje
350 184 52%
950 274 29%
1,500 306 20%
8,000 367 5%
20,000 377 2%

Carlos Payno Sánchez, 2013


Comprobar los tamaños de las muestras

Intervalo de confianza del 70% ( Z = 1.04 )


error del 5% y p = q = 50%
Población N Muestra ”n” Porcentaje
350 83 24%
950 97 10%
1,500 101 7%
8,000 107 1%
20,000 107 0.5% “<1%”

Carlos Payno Sánchez, 2013


Comprobar los tamaños de las muestras

Intervalo de confianza del 70% ( Z = 1.04 )


error del 1.5% y p = 65% q = 35%
Población N Muestra ”n” Porcentaje
350 265 76%
950 508 54%
1,500 631 42%
8,000 957 12%
20,000 1031 5%

Carlos Payno Sánchez, 2013

También podría gustarte