Carlos Eduardo Valdivieso Taborga, Roberto Valdivieso Castelln, Oscar lvaro Valdivieso Taborga
Universidad Privada Boliviana
cvaldivieso@upb.edu
RESUMEN
La determinacin del tamao muestral en una investigacin es de vital importancia, tanto para
caracterizar la distribucin de la variable, como para fijar el grado de precisin del estudio. El
propsito de este artculo es ofrecer ayuda en el clculo del tamao muestral cuando se efecta un
estudio de carcter cuantitativo (limitado al uso de un muestreo aleatorio simple, unietpico y fijo), en
el cual se utilizan mtodos estadsticos inferenciales como medios para el anlisis, como ser la
estimacin estadstica, las pruebas de hiptesis y el anlisis de experimentos, que requieren de
informacin precisa sobre las variables consideradas, y que es obtenida a partir de la muestra
representativa de la respectiva poblacin.
El artculo presenta varias ecuaciones para la determinacin del tamao muestral, agrupadas en 6
figuras, usando la ayuda didctica de los rboles de decisin, que facilitan su eleccin. Con el fin de
ejemplificar la manera de utilizar los rboles de decisin para la eleccin de la ecuacin adecuada en el
clculo del tamao muestral, se muestra un ejemplo de investigacin, que es desarrollado
completamente, desde la concepcin del problema hasta las conclusiones finales. Por otro lado, se
exponen algunas bases tericas y empricas que ayuden a utilizar de la mejor manera posible las
distintas ecuaciones que permiten el clculo del tamao muestral.
Palabras Clave: Clculo del Tamao Muestral, rboles de Decisin, Estadstica Educacional.
1. INTRODUCCIN
1.1. Importancia de la determinacin del tamao muestral
Varios autores coinciden en que una decisin importante en cualquier investigacin es la seleccin adecuada
del tamao muestral (Montgomery [29], Gutirrez y de la Vara [13]). Marrugat et al. [42] sostiene que la
estimacin del tamao muestral puede considerarse un instrumento del que dispone el investigador para evaluar
la factibilidad y la necesidad de recursos de su proyecto. Sin embargo, la utilizacin de hiptesis verosmiles
deber prevalecer sobre otros intereses como las posibilidades econmicas, la disponibilidad de recursos u
otros. No es tico realizar un estudio con un tamao de muestra que no ofrezca un poder estadstico suficiente,
ya que, desde el punto de vista de la metodologa cientfica, el diseo no es adecuado. Kerlinger y Lee [37] y
Camacho-Sandoval [38], afirman que para aquellos investigadores que llevan a cabo grandes investigaciones
donde el costo de la recoleccin de datos es alto, la determinacin del tamao de muestra resulta crtica, ya que
el inters radica en conseguir la mejor informacin al menor costo:
Un tamao de muestra demasiado grande representa un desperdicio de recursos, tanto materiales como
humanos (Fuentelsaz [40]). Adems la calidad del estudio, dado dicho incremento, puede verse afectada en
sentido negativo (Fernndez [39]).
Un tamao demasiado pequeo es un desperdicio de esfuerzo, pues no podr detectar un efecto significativo
o se tendrn menos probabilidades de hacerlo.
Kerlinger y Lee [37] manifiestan que aunque la mayora de los investigadores tratan de simplificar los
conceptos y procedimientos implicados, el proceso de determinacin del tamao muestral para estudios de
investigacin no resulta trivial ni sencillo. De hecho afirman que es uno de los problemas ms difciles en la
estadstica aplicada.
Namakforoosh [34], Kerlinger y Lee [37] y otros autores, mencionan el uso de mtodos con reglas intuitivas
sin justificacin alguna. Uno de ellos es calcular el tamao muestral con base en una proporcin del tamao de
la poblacin (2%), otra es asignar arbitrariamente un valor grande (2000). Ninguna de estas opiniones es vlida.
148
149
(1)
/ n
/2
El valor z es positivo o negativo, segn sea mayor o menor que . La diferencia entre la media muestral
la media poblacional , denotada por e, se conoce como error de muestreo.
(2)
y
n0
/2
(3)
donde la expresin
/2
N n
N 1
(4)
utiliza para rebajar la varianza muestral estimada (Namakforoosh [34]). Despejando n de la ecuacin (4):
n
z2 / 2
z
2
/2
N
e ( N 1)
2
(5)
Siguiendo un procedimiento similar es que se han generado las dems ecuaciones de la Figura 2.
151
Una
No
No
Si
Dos
Figura 3
Una
Figura 4
Dos
Figura 5
No
Si
No
ayor a 2
Si
Figura 6
No
No
Mayor a 2
ANOVA?
Nmero de
poblaciones
involucradas?
152
Infinita
Si
No
Finita
Infinita
Finita
Media
Infinita
Si
Finita
Proporcin
No
Infinita
Finita
VarianzaM
Infinita
Parmetro a estimar?
No
Varianza poblacional
conocida?Se usar el
diseo experimental con
Finita
Tamao
poblacional?
Figura 2 - rbol de decisin para la eleccin del tamao muestral en la estimacin de un parmetro poblacional.
153
No
No
No
Medias
No
Si
Si
No
No
No
Proporciones
Si
Si
No
Varianzas
Qu parmetros se desean
comparar mediante la
estimacin?
Si
No
No
No
No
Varianzas
poblacionales
conocidas?
No
No
Los datos son
pareados?
Varianzas
poblacionales
iguales?
Figura 3 - rbol de decisin para la eleccin del tamao muestral en la estimacin de la comparacin de parmetros poblacionales.
154
Si la poblacin es finita:
Si
No
Media
Si
Proporcin
No
Varianza
Parmetro a probar?
No
Varianza poblacional
conocida?
es la diferencia entre el parmetro poblacional de la hiptesis nula y el estadstico de la muestra.
Figura 4 - rbol de decisin para el clculo del tamao muestral en la prueba de las conjeturas o hiptesis de parmetros poblacionales.
155
Si la poblacin es finita:
Si
No
Medias
Si
Proporciones
No
Varianzas
Qu parmetros se
quieren comparar
mediante hiptesis?
No
Varianza poblacional
conocida?
Figura 5 - rbol de decisin para el clculo del tamao muestral en la prueba de las hiptesis de la comparacin de parmetros poblacionales
156
Fijos
ANOVA Simple
No
Si
Uno
Aleatorios
Fijos
ANOVA de Bloque
Aleatorios
A:
B:
Dos
Fijos
AB:
Diseo Factorial
Nmero de factores?
No
A:
Fuentes de variabilidad
extraa?
Aleatorios
B:
Efectos fijos o
aleatorios?
AB:
a es el nmero de tratamientos de A; b el nmero de bloques o tratamientos de B;
variabilidad de los tratamientos; , efectos de los tratamientos; , variabilidad de los tratamientos; ,
mxima diferencia entre medias de tratamientos;
, efectos de interaccin;
, variabilidad de los efectos de interaccin; , grados de libertad de los tratamientos; , grados de libertad
del error.
Figura 6 - rbol de decisin para el clculo del tamao muestral de diseos experimentales usando ANOVA.
UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)
157
(10)
Si bien se puede despejar n de las dos ecuaciones simultneas, es mejor calcular el tamao muestral mediante
sucesivas iteraciones. Todos los elementos son conocidos, excepto
, que es valor de la distribucin chicuadrada de cola superior de probabilidad , con
grados de libertad.
3.2. Figura 3. rbol de decisiones para la eleccin del tamao muestral en la estimacin de la comparacin de
parmetros poblacionales
3.2.1. Estimacin de la diferencia de medias poblacionales
El error mximo que se puede tolerar en la estimacin de la diferencia de medias con varianzas poblaciones
conocidas pero distintas, viene dado por:
(11)
Generalmente
158
. Despejando
se tiene:
UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)
(12)
Si la poblacin es finita, para cualquier caso de la Figura 3 o de las otras Figuras, se debe calcular el tamao
muestral mediante la siguiente ecuacin (Kerlinger y Lee [37]):
(13)
donde n es el tamao muestral para poblaciones finitas y
De la misma manera, se pueden obtener otras ecuaciones similares cuando no se conocen las varianzas
poblacionales y se las debe estimar mediante muestras piloto, Figura 3.
3.2.2. Estimacin de la diferencia de proporciones poblacionales
El error mximo que se puede tolerar al estimar una diferencia de proporciones poblacionales con varianzas
poblacionales conocidas e iguales, y poblaciones infinitas, viene dado por:
(15)
Si se despeja el tamao muestral suponiendo que las dos muestras tienen el mismo tamao:
(16)
Asimismo se pueden obtener otras ecuaciones para el tamao muestral cuando no se conocen las varianzas
poblacionales, usando el muestreo piloto, Figura 3.
3.2.3. Estimacin del cociente de varianzas poblacionales
Segn StatPoint Inc. [25], el error mximo al estimar el cociente de varianzas poblacionales es:
y
(17)
159
Situacin Real
es cierta
es falsa
Decisin correcta
Error tipo II
Error tipo I
Se rechaza
Decisin correcta
En la prctica, suele ser ms delicado cometer un error tipo I que un error tipo II. Sin embargo, al disminuir
aumentar para un tamao muestral dado.
Segn Kerlinger y Lee [37], en la mayor parte de los casos se tiende a establecer un criterio muy riguroso del
error tipo I, y existe una menor probabilidad de cometerlo. Sin embargo, como existe una relacin entre los
errores tipo I y tipo II, sta debe considerarse antes de realizar la decisin. La Figura 7 muestra esta relacin.
Punto crtico de
decisin
Probabilidad de
error tipo II ( )
Ho es
verdadera
(
)
H1 es
verdadera
(
)
Probabilidad de
error tipo I ( )
160
Me
X
Fuente: Marrugat et al. [42]
, y la distancia
H0
Mc
H1
Me
Todas las dems ecuaciones de la Figura 4 presentan el mismo fundamento. Si se realiza una prueba de una
cola (superior o inferior) se debe cambiar en (18) y (19), en lugar de
.
Fernndez [39] afirma que antes de realizar una prueba de hiptesis se debe definir si va a ser unilateral o
bilateral:
Bilateral: Cualquiera de los dos parmetros a comparar (medias o proporciones) puede ser mayor o menor
que el otro. No se establece direccin.
Unilateral: Cuando se considera que uno de los parmetros debe ser mayor que el otro, indicando por tanto
una direccin de las diferencias.
161
donde
3.4. Figura 5. rbol de decisin para el clculo del tamao muestral en la prueba de hiptesis de la
comparacin de parmetros poblacionales
Las ecuaciones para el clculo del tamao muestral para una prueba de hiptesis de comparacin de parmetros
poblacionales presenta el mismo fundamento que el mostrado en la Figura 4.
3.4.1. Prueba de hiptesis para la diferencia de medias poblacionales
Para el caso de la determinacin del tamao muestral de la prueba de hiptesis de la diferencia de medias, sea
Mc, la primera media poblacional y Me la segunda, X el punto de decisin en una escala de diferencias entre
medias, , el valor de la distribucin normal correspondiente al valor del error aceptado en una prueba
bilateral; , el correspondiente al error aceptado; se asumen que las desviaciones poblacionales son iguales
para simplificar. La especificacin del error correspondiente a la hiptesis alternativa
lleva a:
(21)
De forma similar, la especificacin del riesgo
conduce a:
(22)
(26)
donde es la diferencia
dispuesta como norma.
3.5. Figura 6. rbol de decisin para el clculo del tamao muestral de diseos experimentales usando
ANOVA
Segn Montgomery [29], una curva caracterstica de operacin es una grfica de la probabilidad del error tipo II
de una prueba de inferencia estadstica, para un tamao de muestra particular, contra el parmetro que refleja la
extensin en la cual la hiptesis nula es falsa. Estas curvas son una gua para seleccionar el tamao muestral
para que el diseo sea sensible a diferencias potenciales entre tratamientos.
El modelo experimental es de efectos fijos cuando los tratamientos del diseo experimental son fijados
especficamente por el investigador. Ser de efectos aleatorios cuando los tratamientos han sido seleccionados
aleatoriamente de una poblacin.
3.5.1. Modelo de efectos fijos para un diseo completamente aleatorizado (ANOVA simple)
El modelo de un experimento de comparacin simple con una variable de entrada (un factor), ya sea de
efectos fijos o aleatorios, tiene el siguiente modelo estadstico:
(28)
donde , es el efecto medio global;
Para evaluar esta probabilidad, se requiere conocer la distribucin del estadstico F0 si la hiptesis nula es
falsa. Si eso ocurre F0 tiene distribucin F no centrada, con a-1 y N-a grados de libertad y un parmetro de
descentralizacin . Si
, la distribucin se transforma en la F centrada (a es el nmero de tratamientos
del diseo y N es el nmero de datos del diseo experimental).
Las curvas caractersticas de operacin se muestran en las tablas de anexos de varios libros de anlisis y
diseo de experimentos (Martnez [26], Montgomery [29], Myers [27]), que son los que construyeron Pearson
y Hartley en 1951. En ellas se indica la probabilidad del error tipo II en funcin del parmetro
, que segn
Myers [27] es un ratio F basado en la poblacin; es decir, es n veces la varianza entre las medias de los
tratamientos de la poblacin dividida por la varianza del error de la poblacin, dando como resultado:
(29)
est asociado al parmetro de descentralizacin . Hay curvas para
valores de los grados de libertad del numerador y denominador.
, para diversos
Para hallar n0, el investigador debe dar un valor a . Esto es muy difcil de determinar, pero una forma de
hacerlo es elegir los valores de las medias de tratamiento para los cuales se desea rechazar la hiptesis nula
con una probabilidad alta. Si
son las medias de tratamiento propuestas, el valor de (efectos de
los tratamientos) se encuentra usando la anterior ecuacin, donde cada efecto de tratamiento se calcula
mediante:
(30)
Es decir, el promedio de las medias individuales de tratamiento. Tambin es necesaria una estimacin de ,
que se la obtiene por experiencias pasadas, experimentos previos o estimaciones propuestas. Cuando no hay
seguridad en esta estimacin, el tamao de las muestras puede determinarse para un intervalo de valores
posibles y estudiar sus efectos.
Cuando resulta difcil seleccionar el conjunto de medias de tratamiento sobre el cual se basar la decisin, un
enfoque ms sencillo es seleccionar el tamao de muestra de manera que se rechace la hiptesis nula si la
diferencia entre cualquier par de medias de tratamiento (usualmente se toma la mxima diferencia entre
medias) excede un valor especfico D, donde
se obtiene mediante:
(31)
3.5.2. Modelo de efectos aleatorios para un diseo completamente aleatorizado (ANOVA simple)
Montgomery [29] afirma que la probabilidad del error tipo II para este modelo es:
164
, es el
En un diseo aleatorizado por bloques, es importante determinar el nmero de bloques (b). En el caso del
modelo de efectos fijos, se deben usar las curvas caractersticas de operacin (CCO) con el parmetro
dado por:
(34)
(35)
donde a-1 son los grados de libertad de numerador y (a-1)(b-1) los del denominador (b es el nmero de
bloques del diseo experimental).
Si el modelo es de efectos aleatorios, se usan las CCO con la relacin:
(36)
donde los grados de libertad son los mismos que para el modelo de efectos fijos.
3.5.4. Diseo Factorial
El modelo factorial de dos factores tiene el siguiente modelo estadstico:
(37)
es el efecto del i-simo nivel del factor rengln A; , es el efecto del j, es el efecto de la interaccin entre y ,
, es el componente
165
Grados de
libertad del
numerador
a 1
Grados de
libertad de
denominador
ab(n0-1)
b1
ab(n0-1)
AB
(a-1)(b-1)
ab(n0-1)
Valor mnimo de
Factor
Las curvas caractersticas de operacin, permiten determinar el tamao muestral aproximado para obtener un
poder de prueba especfico en el diseo de efectos aleatorios. Las condiciones se muestran en la Tabla 4.
TABLA 3 - ECUACIONES PARA EL CLCULO DEL TAMAO MUESTRAL
PARA MODELO DE EFECTOS ALEATORIOS
Factor
A
a1
(a 1)(b 1)
b1
(a 1)(b 1)
AB
(a 1)(b 1)
ab(n0 - 1)
5 psi. El clculo se
Preparacin
100
Montaje
160
Acabado
250
Empaquetado
275
Toms
0
80
Preparacin
Preparacin
Preparacin
160
Montaje
110
120
Montaje
Montaje
220
Acabado
Jorge
200
Len
190
Acabado
Acabado
230
Empaquetado
280
290
Empaquetado
Empaquetado
290
315
Katy
A Katy le lleva ms tiempo construir una mesa de roble que a los otros. Adems de ser ms lenta que los otros
empleados, Katy est descontenta con su actual responsabilidad de empaquetado, que la tiene parada la mayor
parte del da. Su primera preferencia es el acabado y la segunda, la preparacin. Len tiene muchos problemas en
167
UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)
110
Preparacin
190
Montaje
290
Acabado
300
Empaquetado
acerca de la
Como quiere
los datos que
objetivos de
1. Jorge cree que la operacin de montaje es la ms crtica del proceso. A cul de sus operarios asignara para
minimizar el tiempo de esa etapa (sin incluir a Randy)? Jorge quiere detectar una diferencia mxima entre
medias de tratamientos de 15 minutos.
2. Como Katy no se siente bien realizando el empaquetado, Jorge quiere entrenarla mejor para que disminuya su
actual tiempo de la operacin de acabado y transferirla a esa etapa. La va a someter a un entrenamiento que
dura un mes. Los resultados despus del periodo de entrenamiento dirn si Jorge podr pasar a Katy a la
operacin de acabado. Jorge solo tolerar un error mximo en la estimacin de medias de 6 minutos.
3. Por otro lado Jorge quiere conocer si Len es mejor o peor que l en la etapa de preparacin. Para averiguarlo
primero quiere determinar si la variabilidad del tiempo de Len difiere con la suya. Posteriormente, y tomando
en cuenta este aspecto, necesita saber si asigna a Len la etapa de preparacin o lo cambia a acabado, que es
donde Jorge sabe que se desempea bien. Cul debe ser la decisin? Jorge quiere detectar una diferencia de
varianzas de 4, y una diferencia de medias de 10.
4. El problema con Katy es bastante complejo. Se sabe que su tiempo es mucho mayor al de Randy en la etapa de
empaquetado. Sin embargo, Jorge medir su rendimiento, no tomando en cuenta el tiempo, sino el nmero de
empaquetados que cumplen las exigencias de calidad. Para ello deber realizar un muestreo del nmero de
mesas mal empaquetadas por los dos. Si Katy tiene mayor nmero de paquetes defectuosos que Randy, Jorge
deber asignar a Katy el trabajo de Randy, es decir, de hacer trabajos variados y sustituir a algn empleado
que falte Cul deber ser la decisin? Jorge estima que la proporcin de mesas mal empaquetadas no debera
sobrepasar del 25% y desea detectar una diferencia de proporciones del 30%.
5. Una vez analizado todo el proceso, Jorge quiere saber cules seran las ubicaciones que debera otorgar a sus
empleados, para obtener un tiempo de fabricacin de mesas ptimo. Quiere llenar los cuadros siguientes con
los nombres adecuados.
Preparacin
Montaje
Acabado
Empaquetado
6. Por ltimo Jorge desea estimar la dispersin de tiempo de todas las etapas con respecto a los operarios en sus
puestos de trabajo asignados ptimamente. Si la dispersin para cualquier etapa rebasa los 5 minutos, entonces
someter al operario respectivo a un periodo de entrenamiento. Quines entrarn a ese programa? El mximo
error que se quiere cometer al estimar la varianza es de 2.
168
Prueba 1 Cola
Prueba 2 Colas
Potencia
(
)
0,800
0,010
2,326
2,576
0,900
1,282
0,050
1,645
1,960
0,950
1,645
0,100
1,282
1,645
0,990
2,326
Significancia
( )
Valor de
Valor de
0,842
169
Se elabora una tabla para el clculo de para distintos tamaos muestrales y se determina en las curvas
caractersticas de operacin (Montgomery [29], pp. 548, Martnez [26], pp. 714) el valor de , para luego
calcular el poder de prueba
, hasta que el valor llegue o sobrepase 0,9, que es el poder adecuado para la
mayora de los experimentos, Tabla 8.
TABLA 8 - CLCULO DEL TAMAO MUESTRAL PARA EL DISEO
COMPLETAMENTE ALEATORIZADO
3
4
5
1,84
2,12
2,37
3
3
3
8
12
16
0,32
0,14
0,05
0,68
0,86
0,95
Con cinco rplicas en el experimento se logra obtener un poder de prueba del 95%.
2. Clculo del tamao muestral para el intervalo de confianza para la diferencia de medias.
Usando la Figura 1, se realiza la siguiente decisin:
Se usar la estimacin estadstica? Si.
Se usar el mtodo de pruebas de hiptesis? No.
Se usar el diseo experimental con ANOVA? No.
Nmero de poblaciones involucradas? Dos.
Remitindose a la Figura 3, se decide de la siguiente manera:
Qu parmetros se desean estimar mediante la comparacin? Medias.
Varianzas poblacionales conocidas? Si. Por dato histrico la varianza es de 25.
Los datos son pareados? No.
Las varianzas de las poblaciones son iguales? Si.
La ecuacin para el tamao muestral para la diferencia de medias es la siguiente:
Si Jorge slo tolera un error mximo en la estimacin de medias de 6 minutos, el tamao muestral es:
Berenson, Levine y Krehbiel [1] afirman que la regla general es redondear hacia arriba.
El clculo es el siguiente, sabiendo que se quiere detectar una diferencia de varianzas de 4, y lograr una
potencia de prueba del 90%:
Para detectar una diferencia de medias de 10 y lograr un poder de prueba del 90%, el tamao muestral ser:
Si
y si quiere un poder de prueba del 90%, el valor del tamao muestral es:
171
El mximo error que se quiere cometer al estimar la varianza es de 2. Jorge elige no realizar una muestra
piloto, sino confiar en que la desviacin de cada etapa es de 5. Se realiza un clculo iterativo, dando como
resultado la Tabla 9 o la Figura 9. Se observa que para un tamao de 25 las dos diferencias del error (e) con el
error calculado (e-e1 y e-e2) por las dos ecuaciones anteriores son positivas y la ltima lo ms cercana a cero.
TABLA 9 - CLCULO DEL TAMAO MUESTRAL DEL INTERVALO DE CONFIANZA PARA LA
VARIANZA
e
n
Iteracin 1
2
24
Iteracin 2
2
25
Iteracin 3
2
26
38,076
39,364
40,646
11,689
1,114
2,014
0,886
-0,014
12,401
1,096
1,956
0,904
0,044
13,120
1,079
1,902
0,921
0,098
e1
e2
e-e1
e-e2
1
0.5
0
-0.5
10
15
20
25
30
35
-1
Figura 9 Solucin grfica del tamao muestral del intervalo de confianza para la varianza.
4.4. Recopilacin de Datos
172
Suma de
cuadrados
2991,458
130,167
3121,625
Grados de
libertad
3
20
23
Promedio de los
cuadrados
997,153
6,508
Probabilidad
153,21
5,8E-14
Valor crtico
para F
3,10
Observando la tabla ANOVA, se concluye que existe diferencia significativa en la etapa de montaje entre los
distintos operarios. Por lo tanto, se deber realizar una prueba LSD, mostrada en las Tablas 15 y 16.
TABLA 7 - DIFERENCIA DE MEDIAS POR EL MTODO LSD
Contraste
Jorge - Katy
Jorge - Len
Jorge Toms
Katy - Len
Katy - Toms
Len - Toms
Sig.
*
*
*
*
*
*
Diferencia
9,3333
-10,5
19,6667
-19,8333
10,3333
30,1667
+/- Lmites
3,0724
3,0724
3,0724
3,0724
3,0724
3,0724
173
Casos
Media
6
6
6
6
60,3333
70,6667
80,0
90,5
Grupos
Homogneos
X
X
X
X
Mediante la prueba LSD se constata que cada operario tiene tiempos diferentes para la operacin de montaje,
siendo el ms rpido Toms.
(2) Intervalo de confianza de la diferencia de medias
Los datos muestrales se ven en la Tabla 17.
TABLA 9 - RESUMEN ESTADSTICO PARA LA PREGUNTA 2
Resumen estadstico
Recuento
Promedio
Varianza
Desviacin estndar
Coeficiente de variacin
Antes
6
100,5
10,7
3,2711
3,25%
Despus
6
99,5
4,3
2,0736
2,08%
Intervalos de confianza del 95,0% para la diferencia de medias suponiendo varianzas iguales: 1,0 +/- 3,5230
[-2,5230; 4,5230]. Como el intervalo contiene el cero, no hay diferencia significativa entre el tiempo de Katy
en la etapa de acabado antes y despus del programa de entrenamiento.
(3) Cociente de varianzas y diferencia de medias
Los estadsticos muestrales se ven en el Tabla 18.
TABLA 10 - RESUMEN ESTADSTICO PARA LA PREGUNTA 3
Resumen estadstico
Recuento
Promedio
Varianza
Desviacin estndar
Coeficiente de variacin
Len
6
110,0
2,0
1,414
1,28%
Jorge
6
80,5
27,5
5,244
6,51%
Antes:
Despus:
Preparacin
Montaje
Acabado
Empaquetado
Toms
Len
Jorge
Katy
Preparacin
Montaje
Acabado
Empaquetado
Jorge
Toms
Len
Randy
Jorge
(Preparacin)
25
80,5000
27,5000
5,2440
Len
(Acabado)
25
85,1667
46,5667
6,8240
Toms
(Montaje)
25
60,3333
13,8667
3,7238
Randy
(Empaquetado)
25
24,5000
2,3000
1,5166
Los intervalos de confianza para cada operario son los siguientes: Jorge: [4,0947; 7,2952]; Len: [5,3284;
9,4932]; Toms: [2,9076; 5,1804]; Randy: [1,1842; 2,1098].
Len ser el nico que deber someterse a un periodo de entrenamiento para disminuir su variabilidad, ya que
el valor de la desviacin 5 cae fuera del intervalo.
5. CONCLUSIONES
El proceso para la determinacin del tamao muestral en una investigacin de carcter cuantitativo, se concreta en la
eleccin de la ecuacin adecuada para cada objetivo y se simplifica mucho recurriendo a la ayuda de los rboles de
decisiones presentado en este artculo.
La determinacin de los parmetros de los que dependen las distintas ecuaciones para calcular el tamao muestral, es
tarea de los expertos en el tema que se quiere investigar (error de muestreo, varianza poblacional, errores tipo I y II,
mximas diferencias a detectar, etc.), y debe ser realizada siempre con una actitud conservadora, sino se consiguen
datos histricos o estimaciones fidedignas para respaldarlos.
Se debe tener en cuenta que los valores hallados con las ecuaciones especficas a la tcnica estadstica usada, son una
gua o una estimacin del nmero de unidades que deber muestrear para cumplir con sus objetivos y lograr la
precisin deseada.
Lo expuesto en este artculo debera permitir concretizar uno de los primeros pasos que se debe resolver en el difcil
proceso de realizacin de un estudio cuantitativo.
175
UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)
176
Berenson, Levine y Krehbiel, Estadstica para Administracin, Pearson Educacin, 2a Ed., Mxico, 2001.
Levin y Rubin, Estadstica para Administradores, Prentice Hall S.A., 6a Ed., Mxico, 1996.
Mason y Lind, Estadstica para Administracin y Economa, Alfaomega, Sptima Edicin, Mxico, 1995.
Freund y Simon, Estadstica Elemental, Prentice Hall, Octava Edicin, Mxico, 1994.
Miller, Freund y Jonson, Probabilidad y Estadstica para Ingenieros, Prentice Hall S.A., 4a Ed., Mxico,
1992.
Mendenhall W., Estadstica para Administradores, Grupo Editorial Iberoamrica, 2a Ed., Mxico, 1990.
Garca M., Socioestadstica, Alianza Editorial, Madrid-Espaa, 1985.
Mood/Graybill, Introduccin a la Teora Estadstica, Editorial Aguilar, 4a Ed., Madrid-Espaa, 1976.
Maisel L., Probabilidad y Estadstica, Fondo Educativo Interamericano, Colombia, 1973.
Hays Y Winkler, Statistics: Probability, Inference and Decision, Holt, Rinehart and Winston Inc., 1971.
Lobez y Casa, Estadstica Intermedia, Editorial Vicens-Vives, 1a Ed., Espaa, 1967.
Montgomery D. C., Control Estadstico de la Calidad, Grupo Editorial Iberoamrica, S.A., Mxico, 1994.
Gutierrez y De La Vara, Anlisis y Diseo de Experimentos, McGraw-Hill Interamericana, 1a Ed., Mxico,
2004.
Programa Ford-Itesm, Inferencia Estadstica, Mdulo 7, Mxico, 1989.
Juran y Gryna, Manual de Control de Calidad, Volumen II, McGraw-Hill, Cuarta Edicin, Espaa, 1993.
Duncan A., Control de Calidad y Estadstica Industrial, Editorial Alfaomega, Mxico, 1989.
Batattacharyya y Johnson, Statistical, Concepts and Methods, John Wiley & Sons, United States of
America, 1977.
Merril y Fox, Introduccin a la Estadstica Econmica, Amorrortu Editores, Argentina, 1969.
Yamane T., Estadstica, Editorial Harla, Mxico, 1974.
Novales A., Estadstica y Econometra, McGraw-Hill Interamericana, Espaa, 1997.
Larson H., Introduction to Probability Theory and Statistical Inference, 2a Ed., Wiley International Edition,
1974.
Giardina B., Manual de Estadstica, Compaa Editorial Continental, Mxico, 1968.
Muxica L., Introduccin a la Estadstica Matemtica, Univ. de Concepcin, Publicaciones Docentes, Chile,
1966.
Hoel P., Introduccin a la Estadstica Matemtica, Biblioteca Interamericana de Estadstica Terica y
Aplicada, Argentina, 1955.
Statpoint Inc., Determinacin del Tamao de Muestra, Manuales en Lnea del Paquete de Computacin
Estadstico Statgraphics Centurion 15.2, 2007.
Martinez A., Diseos Experimentales, Universidad Autnoma de Chapingo, Editorial Trillas, Mxico, 1988.
Myers J., Fundamentals of Experimental Design, University of Massachusetts, Allyn And Bacon, Inc.,
Boston, 1966.
Heizer y Render, Direccin de la Produccin. Decisiones Estratgicas, Cuarta Edicin, Prentice Hall, 1998.
Montgomery D.C., Diseo y Anlisis de Experimentos, Grupo Editorial Iberoamrica, S.A., Mxico, 1991.
Valdivieso C., Valdivieso R. Y Valdivieso O., Uso de rboles de Decisin para la Estimacin Estadstica,
UPB Revista Investigacin y Desarrollo, 10: 105-123, 2010.
Kinnear y Taylor, Investigacin de Mercados: Un Enfoque Aplicado, McGraw Hill, 1994.
Aaker y Day, Investigacin de Mercados, McGraw Hill, Mxico, 1990.
Kotler P., Direccin de Mercadotecnia: Anlisis, Planificacin y Control, Ed. Diana, Mxico, 1985.
Namakforoosh M. N., Metodologa de la Investigacin, Ed. Limusa S.A, Grupo Noriega Ed., Mxico, 1995.
Sampieri, Collado y Lucio, Metodologa de la Investigacin, McGraw Hill, Mxico, 1998.
Briones G., Mtodos y Tcnicas de Investigacin para las Ciencias Sociales, Ed. Trillas, Mxico, 2003.
Kerlinger y Lee, Investigacin del Comportamiento, Cuarta Edicin, McGraw Hill, Mxico, 2002.
Camacho-Sandoval J., Tamao de Muestra en Estudios Clnicos, Acta Mdica Costarricense (AMC), Vol.
50 (1), 2008.
Fernndez P., Determinacin del Tamao Muestral, Cad. Aten Primaria 1996; 3: 138-14, 2001.
Fuentelsaz C., Clculo del Tamao de la Muestra, Matronas Profesin, Vol. 5, N 18, 2004.
Mateu y Casal, Tamao de la Muestra, Rev. Epidem. Med. Prev. , 1: 8-14, 2003.
Marrugat, Vila, Pavesi y Sanz, Estimacin del Tamao de la Muestra en la Investigacin Clnica y
Epidemiolgica, Unidad de Lpidos y Epidemiologa Cardiovascular. Unidad de Informtica Mdica.
Instituto Municipal de Investigacin Mdica (IMIM), Med Clin (Barc), 1998; 111: 267-276.
UPB - INVESTIGACIN & DESARROLLO 11: 148 176 (2011)