Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Con el propósito de demostrar que realmente existe una relación entre las
variables, que se pudo observar con él uso de la Q de Kendall, a esas mismas
variables y datos se les aplicará la prueba de significación Chi-cuadrada
aplicando para ello la formula siguiente:
X²= Σ (fo-fe)²
fe
Dónde:
Σ = Sumatoria
fo = Frecuencia observada
fe = Frecuencia esperada
X² = Chi-cuadrado
Importante es describir que en este tipo de comprobaciones de hipótesis se
utilizan dos; la hipótesis de investigación representada por el símbolo (Hi)
que es la que está planteando el investigador, y que a su vez señala que si hay
relación, y la hipótesis nula representada por el símbolo (Ho) que indica que
no existe relación en entre las variables, para hacer uso de esta herramienta de
estadística también se debe determinar el valor de Chi-cuadrado teórico que
obtiene por medio de los grados de libertad ( V) calculados con la siguiente
fórmula: V = (f-1) (c-1)
En donde:
136
Apuntes de Investigación Sociológica
V = Grados de libertad
f = Número de filas (que para este caso es 2)
c = Numero de columnas (que para este caso es 2)
De ahí los grados de libertad que se obtienen deben buscarse en la tabla
de Chi-cuadrado (ver anexo). Más adelante se desarrolla un ejercicio para
apreciar la forma como esta herramienta se utiliza ya aplicado a un caso
137
Apuntes de Investigación Sociológica
práctico. Además en este tipo de prueba se utilizan niveles de confianza,
y generalmente se emplea el 95 y 99 porciento, que están dados tanto en
las tablas de área normal como de la chi-cuadrada. En base a los datos
obtenidos se elaboran tablas de contingencia (2x2, 3X3 o más según el caso
y la necesidad) que contienen en sus dos o tres filas (recuadros horizontales)
los resultados de las respuestas (si, no, o siempre, algunas veces o nunca) de la
variable independiente y variable dependiente; siendo los datos en mención,
la frecuencia observadas ( fo ) habiendo procedido a calcular las frecuencias
esperadas (fe), de acuerdo a la siguiente forma :
CUADRO TEORICO
N N N N
A B n₁
C D n₂
n₃ n₄ N
Una vez que de forma breve se ha ilustrado al lector sobre la forma como
se desarrolla la chi-cuadrada se procederá a sustituir la misma información
obtenida en el coeficiente de Kendall Q. en el cuadro teórico:
A B n₁
80 20 100
C D n₂
30 70 100
n₃ n N
110 ₄ 200
90
138
Apuntes de Investigación Sociológica
Una vez que ya se tiene el cuadro con los datos se procede a obtener las
frecuencias esperadas utilizando las formulas descritas anteriormente.
N 200
N 200
N 200
N 200
139
Apuntes de Investigación Sociológica
Desarrolladas las formulas de la chi-cuadrada se procede de la siguiente
manera: para obtener los datos de la columna 2 se copian las cantidades
que aparecen en el cuadro teórico de acuerdo a la letra que corresponde,
en el caso de la columna 3 esta se obtiene de los resultados donde se aplicó
la formula, para la columna 4, a la frecuencia observada (fo) se le resta la
frecuencia esperada (fe) así; (80-55 = 25 ) y así sucesivamente, en cuanto a la
columna 5, se eleva el resultado que se obtuvo en la columna 4 al cuadrado.
Finalmente la columna 6 se obtiene de dividir el resultado de la columna 5
entre la frecuencia esperada (fe) que aparece en la columna 2 así (625/55 =
11.3636).
Cuadro No. 7
Desarrollo de la Chi-cuadrada
Columna 2 3 4 5 6
1
fo fe fo-fe (fo-fe)² (fo-fe)²
Fe
A 80 55 25 625 11.3636
C 30 55 -25 625 11.3636
B 20 45 -25 625 13.8889
D 70 45 25 625 13.8889
50.5051
Cuando ya se tiene desarrollado el cuadro se obtiene la chi-cuadrada calculada,
tal como se puede observar esta es igual a 50.5051. y es precisamente este
valor el que se necesita confrontar con el valor de la chi-cuadrada teórica
mismo que como ya se dijo se obtiene de las tablas respectivas que aparecen
en el anexo, pero utilizando la formula siguiente. V = = (f-1) (c-1)
En donde:
V = Grados de libertad
f = Número de filas (que para este caso es 2)
140
Apuntes de Investigación Sociológica
c = Numero de columnas (que para este caso es 2)
Sustituyendo en la fórmula: como ya se sabe que las filas (f ) son dos dentro
del paréntesis escribimos 2 así y el -1 es constante (2-1), nos da como
resultado 1, hacemos lo mismo para obtener columnas ( c ) = (2-1) = 1,
el paso siguiente es multiplicar los resultados así ( 1 ) ( 1 ) = 1 y estos son
los grados de libertad V = 1 ( se debe aclarar que cuando las tablas
son de 3 filas por 2 columnas los datos cambian a excepción del -1 que es
una constante dentro de la fórmula ) que deben buscarse en la tabla de la
distribución de Chi-cuadrada ver apéndice. Para ello buscamos en la columna
donde dice grados de libertad ( g.l ) hacia abajo en donde esté el número 1, y
después de manera horizontal siguiendo esa fila buscamos X² 0.95 (que es el
nivel de confianza) y la cantidad obtenida es, 3.84 con el objeto de dejar claro
cómo se obtiene el coeficiente se reproduce una parte de la tabla para que
el lector pueda comprender como se debe buscar el dato utilizando la tabla
de chi-cuadrada
TABALA DE CHI-CUADRADA X²
141
Hi = La hipótesis de investigación, nos indica que si existe relación entre
variables.
Ho =La hipótesis nula, nos indica que no existe relación entre variables. Si se
rechaza la hipótesis nula no se rechazará entonces la hipótesis de investigación
y para determinar si lo anterior es cierto se emplea el siguiente esquema.
GRAFICA No. 1
DISTRIBUCION CHI CUADRADO X²
X² 3.84 X² 50.505
DETERMINACIÓN DE LA MUESTRA
n = el tamaño de la muestra.
N = tamaño de la población
∂= Desviación estándar de la población que, generalmente cuando no se tiene su valor, suele utilizarse
un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor,
se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en relación al 99% de
confianza equivale 2,58, valor que queda a criterio del encuestador
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse
un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador
143
Reemplazando valores en la fórmula se obtiene:
2000*0.5² * 1.96²
(2000-1)0.05² + 0.5² * 1.96²
Resolviendo
. n = 2000 * 0.25 * 3.8416 = 1920.80 = 1920.80 =
322.39
(1999) *0.0025 + 0.25 *3.8416 4.9975 + 0.9604 5.9579
El resultado de la muestra es: 322.39 aproximado a 322. Esta sería la
cantidad de personas a encuestar.
Aunque para ello deba sopesar las ventajas y desventajas de trabajar con una
muestra de una determinada magnitud. En principio, una muestra grande,
produce información más confiable, cuando la población es relativamente
pequeña. Por el contrario, una muestra pequeña extraída de una población
grande, proporciona información más confiable de esta población y su grado
de representatividad y generalización es mayor. Existen muchas técnicas
para calcular el tamaño de una muestra. Cada una de ellas parte de criterios
144
específicos derivados de las características que tienen las investigaciones que
se desean realizar. Se debe considerar los siguientes criterios para que tengan
validez estadística, debido a que solo el Muestreo Aleatorio garantiza un
menor grado de fracaso al realizar la investigación.
Para poder dejar claro lo relacionado con el muestreo es necesario aclarar que
el cálculo del tamaño de la muestra se realiza mediante fórmulas distintas,
según se trate del tamaño de la población y en donde en cualquiera de los dos
casos los valores contenidos en ellas se obtienen por medio de los siguientes
pasos.
6.1.2.1 Nivel de confianza “Z”: Es el criterio de certeza probabilística
de que se toma a los elementos adecuados en el momento de
seleccionar la muestra, Y va del 0% al 100% de confianza. Como
una forma de simplificar el entendimiento de esta parte se presenta una
tabla que ilustra los coeficientes de confianza más utilizados, mismos que
son obtenidos de la tabla de áreas bajo la curva normal. Aunque esto no
exime al estudiante de consultar otros documentos que traten este tema
estadístico.
145
6.1.2.1.1 Margen de error “E”: Es la probabilidad de un porcentaje
calculado, de error en la selección de la Muestra o en los
procesos de recolección e interpretación de Datos, al igual
que Z sus valores van del 0% al 100% de error muestral.
Aunque algunos autores sostienen que regularmente se
trabaje con el 5 %, ya que las variaciones superiores a 10%
reducirán demasiado la validez de la información, sin
embargo esto queda a criterio del investigador de acuerdo a
su experiencia en investigaciones que necesitan establecer
muestras.
n= Z² pq
E²
En donde :
n = tamaño de la muestra ?
z = nivel de confianza 1.96
p = Probabilidad de éxito 0.65
q = Probabilidad de fracaso 0.35 ( 1 – P = Q 1 – 0.65 = 0.35 )
E = 0.05
Tal como se puede observar el valor de Z se obtiene de la tabla que se
explicó anteriormente y obedece a la experiencia y criterio del investigador,
que para el presente ejemplo se tomó el 95 %. Si se sustituyen los valores
en la formula se tendrá lo siguiente.
147
Pero imaginemos que para tener un resultado más confiable se debe muestrear,
tanto el área urbana como el área rural, y para ello es preciso conocer las
comunidades y su población, así como la forma en que está distribuida la
población por género, esto con la finalidad de evitar que se parcialice hacia
un solo grupo o hacia una sola área. En el siguiente cuadro se muestra la
población y la forma como se distribuiría la muestra de forma proporcional,
así como la cantidad de boletas que deberían pasarse a cada comunidad.
CUADRO No. 12
DISTRIBUCIÓN DE LA POBLACION POR GÉNERO
MUNICIPIO DE SAN MARCOS
AÑO 2015
HOMBRES MUJERES
No POB HOMBRES MUJERES % PROP MUESTRA Q.B/C ENCUESTAR ENCUESTAR
1 Area urbana 11,373 5,573 5,800 0.44 350.00 154 75 79
2 El Rodeo 846 406 440 0.03 350.00 11 5 6
3 El Rincon 1,530 765 765 0.06 350.00 21 10 11
4 Colonia J.R B 686 343 343 0.03 350.00 11 5 6
5 Las lagunas 1,999 1,000 1,000 0.08 350.00 28 14 14
6 la Federació 1,792 896 896 0.07 350.00 24 12 12
7 Serchil 1,647 824 824 0.06 350.00 21 11 10
8 San Sebastia 609 305 305 0.02 350.00 7 3 4
9 S. R. Soche 3,262 1,631 1,631 0.12 350.00 42 21 21
10 El recreo 691 346 346 0.03 350.00 10 5 5
11 Caxaque 1,487 744 744 0.06 350.00 21 10 11
25,922 12,830.35 13,091.65 1.00 350 171 179
Para que al lector le quede claro se describirán cada uno de los pasos, que se
utilizaron para realizar el cuadro anterior:
148
• Primero: se determinó el porcentaje proporcional en relación al total de la
población para determinar la cantidad de boletas que se necesitan pasar,
dividiendo la población del municipio de San Marcos, área urbana, entre
el total de población así: 11,373/25922= 0.44, y así con cada comunidad.
• Segundo: multiplicar el tamaño de la muestra por cada porcentaje
proporcional, para determinar la cantidad de boletas que deben pasarse
en cada comunidad y área urbana, en este caso se obtiene la cantidad de
boletas para el área urbana del Municipio de San Marcos: 350 x 0.44 =
154 personas que se tienen que encuestar, (cantidad de boletas que tienen
que pasarse) y así sucesivamente con las demás.
• Tercero: para que el estudio tenga un mayor equilibrio, multiplicar el total
de boletas de cada comunidad por el porcentaje de hombre y mujeres, la
forma para obtener estos porcentajes es; dividiendo el total de mujeres y
hombres, entre el total del población de cada comunidad o área, (5,573 /
11,373 = 0.49 para hombres y 5800/ 11,373 = 0.51 para mujeres.)
• Cuarto: una vez que se tienen estos porcentajes tanto de hombres como
mujeres se procede a multiplicar la cantidad de boletas por el porcentaje
obtenido y de esta operación se obtiene la cantidad de boletas que deben
pasarse a hombres y mujeres (154 x 0.49 = 75 boletas para los hombres.
154 x 0.51 = 79 boletas para mujeres). Así por cada comunidad.
Para muestras de estudios más complejos, cuando la población es menor a
10,000 elementos se debe utilizar la siguiente formula,
n= Z² q
E² p
1+ 1 Z² q 1
N E² p
149
En donde :
n = tamaño de la muestra
N = tamaño de la población
Z = nivel de confianza
P = Probabilidad de éxito
Q = Probabilidad de fracaso
E = Error
Caso II: se desea realizar un estudio sobre la Percepción que tiene los jóvenes
sobre el delito en el Municipio de San Marcos, con el objeto de saber que
piensa este sector de la población sobre un tema tan delicado en los últimos
años, y para ello se utilizará un nivel de confianza del 95 % una probabilidad
de éxito (p) 65 % y una probabilidad de fracaso ( q ) 35 % un error ( E
) 10 % y se sabe que el tamaño de la población es de 8600. Cabe aclarar
que este tipo de muestreo también aplica a expedientes, facturas, cuando
son muchos y no se tiene el tiempo suficiente para revisar todos entonces
se puede tomar una muestra, esto en el caso de que un estudiante quisiera
estudiar determinados casos específicamente en el campo jurídico o de la
contaduría pública y auditoria.
Resolviendo:
n = tamaño de la muestra ?
N = tamaño de la población 8,600
Z = nivel de confianza 1.96
P = Probabilidad de éxito 0.65
Q = Probabilidad de fracaso 0.35 ( 1 – P = Q 1 – 0.65 = 0.35 )
E = 0.10
Sustituyendo en la formula los datos
150
2
1.96 0.35
2
0.1 0.65
2
1 + 1 1.96 0.35 1
8600 2
0.1 0.65
Resol vi endo
1 0.00011628 205.86
n= 1.0239367
n= 206.855385 numerador
1.02393667 denominador
152
153