Está en la página 1de 10

Estadística aplicada a la Investigación (Electiva)

UNIVERSIDAD NACIONAL EXPERIMENTAL


“FRANCISCO DE MIRANDA”
PROGRAMA DE EDUCACIÓN
ÁREA CIENCIAS DE LA EDUCACIÓN

SANTA ANA DE CORO; JULIO DE 2012

Licdo. Anthony Ramos UNEFM 2009 Página 1


Estadística aplicada a la Investigación (Electiva)

CÁLCULO TAMAÑO DE LA MUESTRA

ANÁLISIS ESTADÍSTICO

CÁLCULO DEL TAMAÑO ÓPTIMO DE LA MUESTRA

Para determinar el tamaño de una muestra se deberán tomar en cuenta varios


aspectos, relacionados con el parámetro y estimador, el sesgo, el error muestral, el
nivel de confianza y la varianza poblacional.

El parámetro se refiere a la característica de la población que es objeto de


estudio y el estimador es la función de la muestra que se usa para medirlo.

Ejemplo: Para evaluar la calidad de un grupo de estudiantes (parámetro) se


mide a través de los promedios obtenidos (estimador).

El error muestral siempre se comete ya que existe una pérdida de la


representatividad al momento de escoger los elementos de la muestra. Sin embargo, la
naturaleza de la investigación nos indicará hasta qué grado se puede aceptar.

El nivel de confianza, por su parte, es la probabilidad de que la estimación


efectuada se ajuste a la realidad; es decir, que caiga dentro de un intervalo determinado
basado en el estimador y que capte el valor verdadero del parámetro a medir.

Tamaño de Muestra para Proporciones


Cuando deseamos estimar una proporción, debemos conocer varios aspectos:
a) El nivel de confianza o seguridad (1 - α). El nivel de confianza prefijado da lugar a
un coeficiente (Zα).

Ejemplo: Para una seguridad del 95%, Zα = 1.96, para una seguridad del
99%, Zα = 2.58. (Estos valores provienen de las tablas de la distribución normal Z).

b) La precisión que deseamos para el estudio.

Licdo. Anthony Ramos UNEFM 2009 Página 2


Estadística aplicada a la Investigación (Electiva)

c) Una idea del valor aproximado del parámetro que queremos medir (en este
caso una proporción). Esta idea se puede obtener revisando la literatura, por estudio
pilotos previos. En caso de no tener dicha información utilizaremos el valor p = 0.5
(50%). El problema que puede enfrentarse en un estudio de investigación es la cantidad
de información con la que se cuente; específicamente se pueden tener dos casos:
desconocer la población del fenómeno estudiado, o bien, conocerla.

Cálculo del Tamaño de la Muestra conociendo el Tamaño de la Población.

La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la


población es la siguiente:

N Z2  p  q
nopt.  2
d  (N - 1)  Z 2  p  q
En donde:
N = tamaño de la población
Z = nivel de confianza,
p = probabilidad de éxito, o proporción esperada
q = probabilidad de fracaso
d2 = precisión (Error máximo admisible en términos de proporción)

Ejemplo No. 1: ¿A cuántas familias tendríamos que estudiar para conocer la


preferencia del mercado en cuanto a las marcas de shampoo para bebé, si se conoce
que el número de familias con bebés en el sector de interés es de 15,000?
Seguridad = 95%;
Precisión = 3%;
Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviese
ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el
tamaño muestral.

Licdo. Anthony Ramos UNEFM 2009 Página 3


Estadística aplicada a la Investigación (Electiva)

15000 (1.96)2  0.05  0.95


nopt.   200
0.03 2  (15000 - 1)  (1.96)2  0.05  0.95
Análisis: Se requeriría encuestar a no menos de 200 familias para poder tener una
seguridad del 95%.

Ejemplo No. 2: ¿Cómo hubiera cambiado el ejemplo anterior, si se desconoce la


proporción esperada?

Cuando se desconoce la proporción esperada, se tiene que utilizar el criterio


conservador (p=q=0.5) = lo cual maximiza el tamaño de la muestra de la siguiente
manera:
Entonces:
• Zα = 1.962 (ya que la seguridad es del 95%)
• p = proporción esperada (en este caso 50% = 0.5)
• q = 1 – p (en este caso 1 – 0.5 = 0.5)
• d2 = precisión (en este caso deseamos un 3%) quedando como resultado:

15000 (1.96)2  0.5  0.5


nopt.   996
0.03 2  (15000 - 1)  (1.96)2  0.5  0.5
Análisis: Se requeriría encuestar a no menos de 996 familias para poder tener una
seguridad del 95%.

EJEMPLO 3 :La población objeto de estudio estará conformada por todos los
pacientes de ambos sexos entre 40 y 65 años de edad que ingresan mensualmente al
Hospital X, los cuales según cifras obtenidas del servicio X asciende a 1500 pacientes,
los cuales cumplieron con los criterios de inclusión y exclusión.

MUESTRA
Para el cálculo de la muestra se utilizó la fórmula del tamaño óptimo de muestra
cuando la población es conocida, y se obtuvieron los siguientes resultados:

Licdo. Anthony Ramos UNEFM 2009 Página 4


Estadística aplicada a la Investigación (Electiva)

Z2  N  σ 2
nopt.  2
Z  σ 2  N  E2

nopt. 
1,96  1500  0,16
2
 90,3  90
1,962  0,16  1500  0,082

Donde:
N = Tamaño de la población = 1500 pacientes
p = Probabilidad de tener factor de riesgo = 80%
q = 1 – p = Probabilidad de no tener factor de riesgo = 20%
Z = 1,96 (Valor en la tabla de la distribución Normal Estándar correspondiente a un
Nivel de Confianza del 95%)
E = Error máximo permisible = 8%
2 = Varianza de la Población = p x q = 0,16

El tamaño óptimo de la muestra es de 90 pacientes del Hospital X.


Otra fórmula es la del autor Sierra (1992);

4  N p x q
nopt. 
E  (N  1)  4  pxq
2

Donde:
N = Tamaño de la población
p = Probabilidad de tener factor de riesgo
q = 1 – p = Probabilidad de no tener factor de riesgo
Z = 1,96 (Valor en la tabla de la distribución Normal Estándar correspondiente a un
Nivel de Confianza)
E = Error máximo permisible
4= Constante

Licdo. Anthony Ramos UNEFM 2009 Página 5


Estadística aplicada a la Investigación (Electiva)

Gabaldon (1980):

Z2  N p x q
nopt. 
( N  1) xE 2  Z 2  p x q

Kish, 1982 cp Parra Olivares (2006):

1
( ). NI S I2
n opt.  N
2
E 1
( 2 )  ( 2 ). NI S I2
Z N

Cálculo del Tamaño de la Muestra desconociendo el Tamaño de la Población.


La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño
de la población es la siguiente:

Z2  pq
nopt. 
d2
Z = nivel de confianza,
p = probabilidad de éxito, o proporción esperada
q = probabilidad de fracaso
d 2 = precisión (error máximo admisible en términos de proporción)

Ejemplo No. 4: ¿A cuántas familias tendríamos que estudiar para conocer la


preferencia del mercado en cuanto a las marcas de shampoo para bebé, si se
desconoce la población total?
Seguridad = 95%;
Precisión = 3%;

Licdo. Anthony Ramos UNEFM 2009 Página 6


Estadística aplicada a la Investigación (Electiva)

Proporción esperada = asumamos que puede ser próxima al 5%; si no


tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que
maximiza el tamaño muestral.
Entonces:
• Zα = 1.962 (ya que la seguridad es del 95%)
• p = proporción esperada (en este caso 5% = 0.05)
• q = 1 – p (en este caso 1 – 0.05 = 0.95)
• d 2 = precisión (en este caso deseamos un 3%)

1.96 2  0.05  0.95


nopt.   203
0.032
Análisis: Se requeriría encuestar a no menos de 203 familias para poder tener una
seguridad del 95%.

Ejemplo No. 5: ¿Cómo hubiera cambiado el ejemplo anterior, si se desconoce la


proporción esperada?
Cuando se desconoce la proporción esperada, se tiene que utilizar el criterio
conservador (p = q = 0.5) = lo cual maximiza el tamaño de la muestra de la siguiente
manera:
Entonces:
• Zα = 1.962 (ya que la seguridad es del 95%)
• p = proporción esperada (en este caso 50% = 0.5)
• q = 1 – p (en este caso 1 – 0.5 = 0.5)
• d 2 = precisión (en este caso deseamos un 3%)

1.96 2  0.5  0.5


nopt.   1068
0.032
Análisis: Se requeriría encuestar a no menos de 1068 familias para poder tener una
seguridad del 95%.

Otra fórmula muy similar a la anterior es la siguiente:

Licdo. Anthony Ramos UNEFM 2009 Página 7


Estadística aplicada a la Investigación (Electiva)

Población desconocida

Z 2  2
nopt. 
E2
Z = Valor estandarizado en función del grado de confiabilidad de la muestra calculada.
Por ejemplo, si consideramos trabajar con un 95% de confiabilidad la muestra
seleccionada, entonces el valor estandarizado asumir es igual a 1.96 (Para dos colas).
Algunos valores estandarizados (z) en función de grado de confiabilidad asumido (para
dos colas):
Para un: 99 % ------------- z = 2, 58 (Empleado con frecuencia)
95 % ------------- z = 1, 96 (El más empleado)
90 % ------------- z = 1, 64

E: Error asumido en el Cálculo. Toda expresión que se calcula contiene un error de


cálculo debido a las aproximaciones decimales que surgen en la división por decimales,
error en la selección de la muestra, entre otras, por lo que este error se puede asumir
entre un 1 hasta un 10%; es decir, que se asume en valores de probabilidad
correspondiente entre un 0.01 hasta un 0.1. No obstante, se propone la siguiente tabla
para valores óptimos del error para el cálculo del número de elementos de una muestra:
Para 3 ≤ N ≤ 10 --------------------- Se asume E = 0.1 (un error del 10 %).

Para N > 10 --------------------- Se asume E = 0.05 (un error del 5 %).

2 = Varianza de la Población = p x q

q: probabilidad de la población que no presenta las características.


Este es un parámetro muy importante, debido a que mediante el mismo se asume qué
por ciento o proporción de la muestra no puede presentar las mismas características de
la población, debido a diversos factores subjetivos y objetivos de los individuos u
objetos que conforman la población. Muchos autores plantean esta probabilidad entre
un 1 hasta un 25 %, otros asumen, cuando no se conoce esta variable asumir el valor
máximo de 50 %. Se propone la siguiente tabla:
Para 3 ≤ N ≤ 19 ------- Se asume q = 0,01 (un 1 %).
Para 20 ≤ N ≤ 29 ------ Se asume q = 0,01 hasta 0,02 (del 1 al 2 %).
Para 30 ≤ N ≤ 79 ----- Se asume q = 0,02 hasta 0,05 (del 2 al 5 %).
Para 80 ≤ N ≤ 159 ---- Se asume q = 0,05 hasta 0,10 (del 5 al 10 %).

Licdo. Anthony Ramos UNEFM 2009 Página 8


Estadística aplicada a la Investigación (Electiva)

Para N ≥ 160 --------- Se asume q = 0,05 hasta 0,20 (del 5 al 20 %).

p: Probabilidad de la población que presenta las características. Dicho de una


forma más comprensible, es la probabilidad que tiene la muestra en poseer las
mismas cualidades de la población (homogeneidad) y está determinada por:
Como p + q = 1 (Probabilidad máxima), p = 1 – q

Conclusiones sobre el nivel de seguridad en el muestreo


Según diferentes seguridades, el coeficiente de Zα varía así:
• Si la seguridad Zα fuese del 90% el coeficiente sería 1.645
• Si la seguridad Zα fuese del 95% el coeficiente sería 1.96
• Si la seguridad Zα fuese del 97.5% el coeficiente sería 2.24
• Si la seguridad Zα fuese del 99% el coeficiente sería 2.576

IMPORTANTE: Si los recursos del investigador son limitados, debe recordar que
a medida que se disminuya el nivel de seguridad, se permitirá un mayor error en el
estudio de investigación, lo cual a su vez permitirá al investigador trabajar con un
número de muestra más reducido, sacrificando la confiabilidad de los resultados.

EJERCICIOS

A continuación se presentan algunos problemas de investigación en la cual


debes aplicar el tamaño óptimo de la muestra cuando la población es conocida.

1. Determinar el tamaño óptimo de la muestra adecuado, para estimar la altura


media de los estudiantes de la Unefm cuya matricula es de 1.500 estudiantes,
con un error máximo admisible de 3 cm y un nivel de confianza del 95%.
Nota : aplicar a este mismo ejercicio un nivel de confianza del 99%

2. Se esta realizando una investigación a tres secciones de estadística para


diagnosticar el rendimiento académico de la misma, la cual tiene una

Licdo. Anthony Ramos UNEFM 2009 Página 9


Estadística aplicada a la Investigación (Electiva)

población total de 700 estudiantes, calcular el tamaño optimo de la muestra y


trabajar con un nivel de confianza del 95%

3. Se desea aplicar un instrumento de investigación para determinar la baja


motivación de los estudiantes en la unidad curricular matemática, la población
esta conformada por 550 estudiantes distribuidos en 5 secciones, calcular el
tamaño optimo de la muestra con un nivel de confianza de un 99%

4. Se quiere aplicar un instrumento de investigación para diagnosticar el nivel de


conocimientos que poseen los estudiantes en el contenido temático cónicos,
la población está conformada por 450 estudiantes calcular el tamaño óptimo
de la muestra con nivel de confianza de 95% Nota: Realizar este mismo
problema cuando se desconoce la proporción esperada ó probabilidad de
éxito.

Importante: Para cada problema realizar el análisis estadístico


respectivo.

Licdo. Anthony Ramos UNEFM 2009 Página 10

También podría gustarte