Está en la página 1de 18

Apuntes de Investigación Sociológica

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA


CENTRO UNIVERSITARIO DE SAN MARCOS
CARRERA: ABOGADO Y NOTARIO Y LICENCIATURA EN CIENCIAS JURIDICAS
Y SOCIALES
CURSO: METODOS Y TECNICAS DE INVESTIGACION SOCIAL
M.A. LUIS EDGARDO REYNA GOMEZ

TOMADO DEL LIBRO, APUNTES DE INVESTIGACIÓN SOCIOLOGICA. DEL M.A.


LUIS REYNA GOMEZ.
6.1.1 Prueba de significación chi-cuadrado

Con el propósito de demostrar que realmente existe una relación entre las
variables, que se pudo observar con él uso de la Q de Kendall, a esas mismas
variables y datos se les aplicará la prueba de significación Chi-cuadrada
aplicando para ello la formula siguiente:
X²= Σ (fo-fe)²
fe
Dónde:
Σ = Sumatoria
fo = Frecuencia observada
fe = Frecuencia esperada
X² = Chi-cuadrado
Importante es describir que en este tipo de comprobaciones de hipótesis se
utilizan dos; la hipótesis de investigación representada por el símbolo (Hi)
que es la que está planteando el investigador, y que a su vez señala que si hay
relación, y la hipótesis nula representada por el símbolo (Ho) que indica que
no existe relación en entre las variables, para hacer uso de esta herramienta de
estadística también se debe determinar el valor de Chi-cuadrado teórico que
obtiene por medio de los grados de libertad ( V) calculados con la siguiente
fórmula: V = (f-1) (c-1)
En donde:

136
Apuntes de Investigación Sociológica
V = Grados de libertad
f = Número de filas (que para este caso es 2)
c = Numero de columnas (que para este caso es 2)
De ahí los grados de libertad que se obtienen deben buscarse en la tabla
de Chi-cuadrado (ver anexo). Más adelante se desarrolla un ejercicio para
apreciar la forma como esta herramienta se utiliza ya aplicado a un caso

137
Apuntes de Investigación Sociológica
práctico. Además en este tipo de prueba se utilizan niveles de confianza,
y generalmente se emplea el 95 y 99 porciento, que están dados tanto en
las tablas de área normal como de la chi-cuadrada. En base a los datos
obtenidos se elaboran tablas de contingencia (2x2, 3X3 o más según el caso
y la necesidad) que contienen en sus dos o tres filas (recuadros horizontales)
los resultados de las respuestas (si, no, o siempre, algunas veces o nunca) de la
variable independiente y variable dependiente; siendo los datos en mención,
la frecuencia observadas ( fo ) habiendo procedido a calcular las frecuencias
esperadas (fe), de acuerdo a la siguiente forma :
CUADRO TEORICO

A = ( n₁ ) ( n₃ ) B = ( n₁ ) (n₄) C = (n₂ ) (n₃ ) D = (n₂ ) (n₄)

N N N N

A B n₁
C D n₂
n₃ n₄ N
Una vez que de forma breve se ha ilustrado al lector sobre la forma como
se desarrolla la chi-cuadrada se procederá a sustituir la misma información
obtenida en el coeficiente de Kendall Q. en el cuadro teórico:

A B n₁
80 20 100
C D n₂
30 70 100
n₃ n N
110 ₄ 200
90

138
Apuntes de Investigación Sociológica
Una vez que ya se tiene el cuadro con los datos se procede a obtener las
frecuencias esperadas utilizando las formulas descritas anteriormente.

A = ( n₁ ) (n₃ ) A= (100) (110 ) A = 55

N 200

Lo que se hizo fue multiplicar el valor de n 1 (100) por el valor de n3 (110) y


dividirlo entre N (200) dando por resultado 55 que es el valor de A y así se
hace para las demás frecuencias

B = ( n₁ ) (n₄) A= (100) (90 ) A = 45

N 200

C = (n₂ ) (n₃ ) A= (100) (110 ) A = 55

N 200

D = (n₂ ) (n₄) A= (100) (90 ) A = 45

N 200

139
Apuntes de Investigación Sociológica
Desarrolladas las formulas de la chi-cuadrada se procede de la siguiente
manera: para obtener los datos de la columna 2 se copian las cantidades
que aparecen en el cuadro teórico de acuerdo a la letra que corresponde,
en el caso de la columna 3 esta se obtiene de los resultados donde se aplicó
la formula, para la columna 4, a la frecuencia observada (fo) se le resta la
frecuencia esperada (fe) así; (80-55 = 25 ) y así sucesivamente, en cuanto a la
columna 5, se eleva el resultado que se obtuvo en la columna 4 al cuadrado.
Finalmente la columna 6 se obtiene de dividir el resultado de la columna 5
entre la frecuencia esperada (fe) que aparece en la columna 2 así (625/55 =
11.3636).
Cuadro No. 7
Desarrollo de la Chi-cuadrada

Columna 2 3 4 5 6
1
fo fe fo-fe (fo-fe)² (fo-fe)²
Fe
A 80 55 25 625 11.3636
C 30 55 -25 625 11.3636
B 20 45 -25 625 13.8889
D 70 45 25 625 13.8889
50.5051
Cuando ya se tiene desarrollado el cuadro se obtiene la chi-cuadrada calculada,
tal como se puede observar esta es igual a 50.5051. y es precisamente este
valor el que se necesita confrontar con el valor de la chi-cuadrada teórica
mismo que como ya se dijo se obtiene de las tablas respectivas que aparecen
en el anexo, pero utilizando la formula siguiente. V = = (f-1) (c-1)
En donde:
V = Grados de libertad
f = Número de filas (que para este caso es 2)

140
Apuntes de Investigación Sociológica
c = Numero de columnas (que para este caso es 2)
Sustituyendo en la fórmula: como ya se sabe que las filas (f ) son dos dentro
del paréntesis escribimos 2 así y el -1 es constante (2-1), nos da como
resultado 1, hacemos lo mismo para obtener columnas ( c ) = (2-1) = 1,
el paso siguiente es multiplicar los resultados así ( 1 ) ( 1 ) = 1 y estos son
los grados de libertad V = 1 ( se debe aclarar que cuando las tablas
son de 3 filas por 2 columnas los datos cambian a excepción del -1 que es
una constante dentro de la fórmula ) que deben buscarse en la tabla de la
distribución de Chi-cuadrada ver apéndice. Para ello buscamos en la columna
donde dice grados de libertad ( g.l ) hacia abajo en donde esté el número 1, y
después de manera horizontal siguiendo esa fila buscamos X² 0.95 (que es el
nivel de confianza) y la cantidad obtenida es, 3.84 con el objeto de dejar claro
cómo se obtiene el coeficiente se reproduce una parte de la tabla para que
el lector pueda comprender como se debe buscar el dato utilizando la tabla
de chi-cuadrada
TABALA DE CHI-CUADRADA X²

g.l X².995 X².99 X².975 X².95 X² .90 X² .75 X² .50 X².25

1 7.83 6.63 5.02 3.84 2.71 1.32 0.455 0.102


2 10.6 9.21 7.38 5.99 4.61 2.77 1.39 0.575
3 12.8 11.3 9.35 7.81 6.25 4.11 2.37 1.21
4 14.9 13.3 11.1 9.49 7.78 5.39 3.36 1.92

Fuente: elaboración propia en base a datos obtenidos de la tabla de la


distribución de chi-cuadrada
Para el presente caso se requiere probar la hipótesis de investigación (Hi)
con un 95 % de confianza, es decir que se tiene un 5 % de error. Y para esto
se utiliza la hipótesis nula (Ho ). Pero veamos cómo se deben plantear:

141
Hi = La hipótesis de investigación, nos indica que si existe relación entre
variables.
Ho =La hipótesis nula, nos indica que no existe relación entre variables. Si se
rechaza la hipótesis nula no se rechazará entonces la hipótesis de investigación
y para determinar si lo anterior es cierto se emplea el siguiente esquema.
GRAFICA No. 1
DISTRIBUCION CHI CUADRADO X²

X² 3.84 X² 50.505

Fuente: Elaboración propia, en base a datos obtenidos de la chi-cuadrado.

La región critica o de rechazo de la hipótesis nula se puede apreciar en la gráfica


anterior, una vez que se conoce el valor de la chi-cuadrada teórica, que como
ya se dijo es la que se busca en la tabla y para este caso hemos utilizado
un nivel de confianza de 0.95 por ciento, con 1 grado de libertad mismo que
representa 3.84 lo que significa que la hipótesis de investigación tal como se
muestra en la anterior grafica está dentro de la región de aceptación. Por lo
tanta aceptamos la hipótesis de investigación.
142
Mientras que cualquier valor de la chi-cuadrada calculada (con la formula)
que sea mayor al de la teórica entrará en la región de rechazo, lo que indica
que la hipótesis nula, se rechazará, y de acuerdo al cálculo de la chi-cuadrada
calculada que se realizó anteriormente (ver cuadro No. 4) el resultado de esta
es de 50.5051. Se puede decir que se rechaza la hipótesis nula y se acepta la
hipótesis de investigación. Ver gráfica. No.1. En
Síntesis se puede concluir que la prueba de chi-cuadrada X² reveló que la
relación encontrada entre las dos variables objeto de análisis, es significativa
con un 95 por ciento de confianza, situación que revela que se tiene un 5 por
ciento de probabilidad de que no lo sea.

DETERMINACIÓN DE LA MUESTRA

n = el tamaño de la muestra.
N = tamaño de la población
∂= Desviación estándar de la población que, generalmente cuando no se tiene su valor, suele utilizarse
un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor,
se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en relación al 99% de
confianza equivale 2,58, valor que queda a criterio del encuestador
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse
un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador

Ejemplo ilustrativo: Si se deseara calcular la muestra de una población de 2000 personas. Y no se


cuenta con mayor información que la cantidad de población. Entonces se hace uso de la siguiente
formula. Aunque esta fórmula se puede utilizar para la obtención de la muestra, se sugiere que sea,
en caso de poblaciones grandes, pero esto queda a criterio del investigador.
Solución:
Se tiene N=2000, y como no se tiene los demás valores se tomará, Z = 1,96 y e = 0,05. Para ello
utilizaremos la siguiente formula:
n= N∂² Z²
(N – 1) e² + ∂² Z²

143
Reemplazando valores en la fórmula se obtiene:

2000*0.5² * 1.96²
(2000-1)0.05² + 0.5² * 1.96²

Resolviendo
. n = 2000 * 0.25 * 3.8416 = 1920.80 = 1920.80 =
322.39
(1999) *0.0025 + 0.25 *3.8416 4.9975 + 0.9604 5.9579
El resultado de la muestra es: 322.39 aproximado a 322. Esta sería la
cantidad de personas a encuestar.

6.1.2 Determinar el tamaño de la muestra


En realidad no existe un criterio definido de la forma como debe determinarse
el tamaño de la muestra y que pueda ser usado de forma universal, porque
este en muchos casos depende de la experiencia y criterio del investigador,
a lo cual debe unirse la disponibilidad de recursos especialmente de tipo
financiero, pues de este dependen el número de personas que pueden
contratarse tanto para trabajo de campo, como de gabinete, he ahí el por qué
no puede trabajarse con la totalidad de la población, y para ello se trabaja con
muestras que deben considerarse desde el momento, en que se realiza la
planificación de la investigación.

Aunque para ello deba sopesar las ventajas y desventajas de trabajar con una
muestra de una determinada magnitud. En principio, una muestra grande,
produce información más confiable, cuando la población es relativamente
pequeña. Por el contrario, una muestra pequeña extraída de una población
grande, proporciona información más confiable de esta población y su grado
de representatividad y generalización es mayor. Existen muchas técnicas
para calcular el tamaño de una muestra. Cada una de ellas parte de criterios
144
específicos derivados de las características que tienen las investigaciones que
se desean realizar. Se debe considerar los siguientes criterios para que tengan
validez estadística, debido a que solo el Muestreo Aleatorio garantiza un
menor grado de fracaso al realizar la investigación.

Para poder dejar claro lo relacionado con el muestreo es necesario aclarar que
el cálculo del tamaño de la muestra se realiza mediante fórmulas distintas,
según se trate del tamaño de la población y en donde en cualquiera de los dos
casos los valores contenidos en ellas se obtienen por medio de los siguientes
pasos.
6.1.2.1 Nivel de confianza “Z”: Es el criterio de certeza probabilística
de que se toma a los elementos adecuados en el momento de
seleccionar la muestra, Y va del 0% al 100% de confianza. Como
una forma de simplificar el entendimiento de esta parte se presenta una
tabla que ilustra los coeficientes de confianza más utilizados, mismos que
son obtenidos de la tabla de áreas bajo la curva normal. Aunque esto no
exime al estudiante de consultar otros documentos que traten este tema
estadístico.

COEFICIENTES DE CONFIANZA COMU NES Y SUS VALORES DE " Z "

Coef. Conf 50% 68.27% 90% 95% 95.45% 99% 99.73%


Z 0.6745 1.00 1.645 1.96 2.00 2.58 3.00

Fuente: Stephen P. Shao. Estadistica para Economistas y Administradores de Empresas,

En términos sencillos, si por ejemplo en la determinación de una muestra


decidiéramos tomar un coeficiente de 95 % significa que en áreas tipificadas
de Z este equivale a 1.96 que sería el valor a sustituir dentro de la fórmula
que más adelantes explicaremos con un caso práctico. Lo anterior induce
a pensar que desde el momento que el investigador utiliza un 95 % como
coeficiente de confianza, significa que se tiene un 95 % de confianza, de
que, la información y datos que se están, obteniendo en el proceso de
investigación son correctos, con un 5 % de probabilidad de cometer un error.

145
6.1.2.1.1 Margen de error “E”: Es la probabilidad de un porcentaje
calculado, de error en la selección de la Muestra o en los
procesos de recolección e interpretación de Datos, al igual
que Z sus valores van del 0% al 100% de error muestral.
Aunque algunos autores sostienen que regularmente se
trabaje con el 5 %, ya que las variaciones superiores a 10%
reducirán demasiado la validez de la información, sin
embargo esto queda a criterio del investigador de acuerdo a
su experiencia en investigaciones que necesitan establecer
muestras.

6.1.2.1.2 Probabilidad de éxito “p”: probabilidad de fracaso; “q”


cuando no se tiene una idea clara de esta situación, es necesario dar sus
máximos valores, tanto a la probabilidad que se realice el evento
favorable, como a la que no se realice. Esto es 50 % a (p) y 50% a (q)
que son las literales que se utilizan para designar la probabilidad a favor o
en contra, respectivamente. Por ejemplo si se otorgara un 50% a p, y un
50% a q, en este casos se supone que existe una total heterogeneidad, es
decir que se tiene una incertidumbre tal que lo que más se puede esperar
es que el 50% de las personas contesten afirmativamente y el otro 50% lo
hagan en forma negativa.

A continuación se presentan dos ejemplos de cómo determinar el tamaño


de la muestra, basado en lo establecido en el libro Guía de Investigaciones
Sociales del autor Raúl Rojas Soriano.

Caso I; para una población mayor de 10,000 habitantes, Los estudiantes de la


carrera de Derecho que funciona en el Centro Universitario de San Marcos,
están interesados en realizar una investigación de campo, relacionada con
la percepción que tiene la población sobre el manejo correcto, que hace el
gobierno de los recursos públicos, que percibe a través de la recaudación
tributaria, y como no cuentan, con los recursos económicos necesarios
para encuestar a toda la población del municipio que de acuerdo al Instituto
Nacional de Estadística INE, asciende a 25,922 habitantes, establece
146
una muestreo probabilístico, y para determinar la muestra utilizarán un nivel
de confianza de 95 % un error ( E ) de 5 % y una probabilidad de éxito de (
P ) 65 % y una probabilidad de fracaso ( Q ) 35 %. Como es una población
mayor a 10,000 se utilizará la siguiente formula:

n= Z² pq

En donde :
n = tamaño de la muestra ?
z = nivel de confianza 1.96
p = Probabilidad de éxito 0.65
q = Probabilidad de fracaso 0.35 ( 1 – P = Q 1 – 0.65 = 0.35 )
E = 0.05
Tal como se puede observar el valor de Z se obtiene de la tabla que se
explicó anteriormente y obedece a la experiencia y criterio del investigador,
que para el presente ejemplo se tomó el 95 %. Si se sustituyen los valores
en la formula se tendrá lo siguiente.

n= 1.96² 0.65 0.35


0.05²
n= 3.8416 0.2275 0.873964
0.0025 0.0025

n= 349.59 aprox. 350 habitantes

147
Pero imaginemos que para tener un resultado más confiable se debe muestrear,
tanto el área urbana como el área rural, y para ello es preciso conocer las
comunidades y su población, así como la forma en que está distribuida la
población por género, esto con la finalidad de evitar que se parcialice hacia
un solo grupo o hacia una sola área. En el siguiente cuadro se muestra la
población y la forma como se distribuiría la muestra de forma proporcional,
así como la cantidad de boletas que deberían pasarse a cada comunidad.
CUADRO No. 12
DISTRIBUCIÓN DE LA POBLACION POR GÉNERO
MUNICIPIO DE SAN MARCOS
AÑO 2015

HOMBRES MUJERES
No POB HOMBRES MUJERES % PROP MUESTRA Q.B/C ENCUESTAR ENCUESTAR
1 Area urbana 11,373 5,573 5,800 0.44 350.00 154 75 79
2 El Rodeo 846 406 440 0.03 350.00 11 5 6
3 El Rincon 1,530 765 765 0.06 350.00 21 10 11
4 Colonia J.R B 686 343 343 0.03 350.00 11 5 6
5 Las lagunas 1,999 1,000 1,000 0.08 350.00 28 14 14
6 la Federació 1,792 896 896 0.07 350.00 24 12 12
7 Serchil 1,647 824 824 0.06 350.00 21 11 10
8 San Sebastia 609 305 305 0.02 350.00 7 3 4
9 S. R. Soche 3,262 1,631 1,631 0.12 350.00 42 21 21
10 El recreo 691 346 346 0.03 350.00 10 5 5
11 Caxaque 1,487 744 744 0.06 350.00 21 10 11
25,922 12,830.35 13,091.65 1.00 350 171 179

Fuente: elaboración propia en base a datos obtenido del INE, 2002

Para que al lector le quede claro se describirán cada uno de los pasos, que se
utilizaron para realizar el cuadro anterior:
148
• Primero: se determinó el porcentaje proporcional en relación al total de la
población para determinar la cantidad de boletas que se necesitan pasar,
dividiendo la población del municipio de San Marcos, área urbana, entre
el total de población así: 11,373/25922= 0.44, y así con cada comunidad.
• Segundo: multiplicar el tamaño de la muestra por cada porcentaje
proporcional, para determinar la cantidad de boletas que deben pasarse
en cada comunidad y área urbana, en este caso se obtiene la cantidad de
boletas para el área urbana del Municipio de San Marcos: 350 x 0.44 =
154 personas que se tienen que encuestar, (cantidad de boletas que tienen
que pasarse) y así sucesivamente con las demás.
• Tercero: para que el estudio tenga un mayor equilibrio, multiplicar el total
de boletas de cada comunidad por el porcentaje de hombre y mujeres, la
forma para obtener estos porcentajes es; dividiendo el total de mujeres y
hombres, entre el total del población de cada comunidad o área, (5,573 /
11,373 = 0.49 para hombres y 5800/ 11,373 = 0.51 para mujeres.)
• Cuarto: una vez que se tienen estos porcentajes tanto de hombres como
mujeres se procede a multiplicar la cantidad de boletas por el porcentaje
obtenido y de esta operación se obtiene la cantidad de boletas que deben
pasarse a hombres y mujeres (154 x 0.49 = 75 boletas para los hombres.
154 x 0.51 = 79 boletas para mujeres). Así por cada comunidad.
Para muestras de estudios más complejos, cuando la población es menor a
10,000 elementos se debe utilizar la siguiente formula,

n= Z² q
E² p
1+ 1 Z² q 1
N E² p

149
En donde :
n = tamaño de la muestra
N = tamaño de la población
Z = nivel de confianza
P = Probabilidad de éxito
Q = Probabilidad de fracaso
E = Error
Caso II: se desea realizar un estudio sobre la Percepción que tiene los jóvenes
sobre el delito en el Municipio de San Marcos, con el objeto de saber que
piensa este sector de la población sobre un tema tan delicado en los últimos
años, y para ello se utilizará un nivel de confianza del 95 % una probabilidad
de éxito (p) 65 % y una probabilidad de fracaso ( q ) 35 % un error ( E
) 10 % y se sabe que el tamaño de la población es de 8600. Cabe aclarar
que este tipo de muestreo también aplica a expedientes, facturas, cuando
son muchos y no se tiene el tiempo suficiente para revisar todos entonces
se puede tomar una muestra, esto en el caso de que un estudiante quisiera
estudiar determinados casos específicamente en el campo jurídico o de la
contaduría pública y auditoria.
Resolviendo:
n = tamaño de la muestra ?
N = tamaño de la población 8,600
Z = nivel de confianza 1.96
P = Probabilidad de éxito 0.65
Q = Probabilidad de fracaso 0.35 ( 1 – P = Q 1 – 0.65 = 0.35 )
E = 0.10
Sustituyendo en la formula los datos
150
2
1.96 0.35
2
0.1 0.65
2
1 + 1 1.96 0.35 1
8600 2
0.1 0.65
Resol vi endo

3.8416 0.35 1.34456 206.86


0.01 0.65 0.0065

1 + 0.00011628 206.86 1 205.86

1 0.00011628 205.86
n= 1.0239367

n= 206.855385 numerador
1.02393667 denominador

n= 202.020 202 Encuestas

Como puede observarse el número de personas que deben ser encuestadas


sería de 202 habitantes mismos que deben ser distribuidos entre hombres
y mujeres, de manera proporcional de acuerdo al número de habitantes de
cada comunidad como en el caso expuesto anteriormente de muestras para
poblaciones mayores de 10,000 habitantes.
Este es solo un ejemplo, en donde los datos se obtuvieron del INE, y su
uso es eminentemente didáctico, en cuanto a las formulas aquí utilizadas
son obtenidas como dije anteriormente del libro, Guía de Investigaciones
151
Sociales de Raúl Rojas Soriano, sin embargo eso no obsta para que el
estudiante consulte otras bibliografías de tipo estadístico. Para distribuir la
muestra se hace el mismo procedimiento que se realizó anteriormente en el
primer ejemplo.

152
153

También podría gustarte