Está en la página 1de 5

Tablas Cruzadas

Otro elemento útil para un acabado conocimiento de la muestra, es la tabla cruzada o de


contingencia. Esta tabla combina dos variables, ordinales o nominales, expresadas en
frecuencias absolutas y/o relativas. Su interpretación depende del foco de atención que nos
interese resaltar, para apreciar las proporciones en que se distribuye la muestra. Así,
podemos centrarnos en las proporciones, tomando el total de la muestra como el 100%, o
fijar este total en alguna de las categorías de las variables. Veremos ejemplos a
continuación.

Sexo * Número de Hijos Crosstabulation


Cantidad de Hijos Total
0 - 1 2 - 3 4 - 5 6 - 7 Mas de
8
Sex Mujer Absolut 9 22 32 6 1 70
o a
% Total 6,4% 15,7% 22,9% 4,3% 0,7% 50,0%
Hombr Absolut 11 20 26 11 2 70
e a
% Total 7,9% 14,3% 18,6% 7,9% 1,4% 50,0%
Total Absolut 20 42 58 17 3 140
a
% Total 14,3% 30,0% 41,4% 12,1% 2,1% 100,0
%

Como vemos en la tabla anterior, los porcentajes se expresan en relación al total de la


muestra (140), es decir, cada frecuencia absoluta está expresada como parte del conjunto
total de casos. Se puede leer por ejemplo, que del total de la muestra, un 22, 9% son
mujeres con 4 o 5 hijos, y un 18,6% son hombres con 4 o 5 hijos.

Podemos centrar nuestro interés en las categorías de sexo y analizarlas por separado, como
veremos en la tabla:

Sexo * Número de Hijos Crosstabulation


Número de Hijos Total
0 - 1 2 - 3 4 - 5 6 - 7 Mas de
8
Sex Mujer Absolut 9 22 32 6 1 70
o a
% Sexo 12,9% 31,4% 45,7% 8,6% 1,4% 100,0
%
Hombr Absolut 11 20 26 11 2 70
e a
% Sexo 15,7% 28,6% 37,1% 15,7% 2,9% 100,0
%
Total Absolut 20 42 58 17 3 140
a
% Sexo 14,3% 30,0% 41,4% 12,1% 2,1% 100,0%

Como vemos, en este caso, tanto el grupo de mujeres como el de hombres, se hacen
equivalentes al 100%. Así, las frecuencias relativas cambian, manteniéndose siempre la
frecuencia absoluta. Se puede decir entonces que del total de mujeres, un 45,7% tienen
entre 4 y 5 hijos y del total de hombres, un 37, 1% tiene entre 4 y 5 hijos.
Finalmente, podemos centrar el análisis en los valores de la variable “Número de hijos”, caso
en el que también variarán las frecuencias relativas:

Sexo * Número de Hijos Crosstabulation


Número de Hijos Total
0-1 2-3 4-5 6-7 Mas de
8
Sex Mujer Absoluta 9 22 32 6 1 70
o % Número de 45,0% 52,4% 55,2% 35,3% 33,3% 50,0%
Hijos
Hombr Absoluta 11 20 26 11 2 70
e % Número de 55,0% 47,6% 44,8% 64,7% 66,7% 50,0%
Hijos
Total Absoluta 20 42 58 17 3 140
% Número de 100,0 100,0 100,0 100,0 100,0% 100,0
Hijos % % % % %

Como vemos, en este caso cada categoría del número de hijos se hace equivalente al 100%.
Al observar esta tabla, podemos decir que del total de personas que tienen entre 4 y 5 ijos,
un 55,2% son mujeres y un 44,8% son hombres.
La comparación de proporciones es útil para determinar si la distribución de la muestra en
función de dos variables se debe a alguna asociación entre ellas o si se debe meramente al
azar. Para comprobarlo, se procede a una prueba conocida como Chi cuadrado, que se verá
en detalle más adelante.
En el caso que veíamos, tanto hombres como mujeres coinciden en agruparse en las
categorías de dos y tres hijos, por lo tanto no existiría una distribución explicada por la
asociación de estas dos variables. Si, por el contrario, las mujeres se hubiesen acumulado
en las categorías de 4 - 5, 6 - 7 o más de 8 hijos, y los hombres en 0 - 1, 2 - 3 o 4 - 5 hijos,
podríamos decir que existe una asociación, es decir, que los hombres tienden a tener menos
hijos que las mujeres, en esta muestra.
Probabilidad

En estadísticas interesa comprobar hipótesis a partir de ciertas fórmulas y números, extraídos de


la observación de las características de una muestra. Para ello se recurre a la comparación de
las muestras estudiadas con una serie de parámetros teóricos basados en modelos
matemáticos. Estos modelos están relacionados con la forma que adquiere la distribución en una
curva, y su comparación con la curva normal, de la cual ya hemos conocido algunas
características. La curva normal supone el modelo que adquiriría la población total o todas las
muestras posibles de estudiar.

La probabilidad, en estadísticas, se aplica a la distribución. El concepto se refiere a la posibilidad


de que ocurra un evento y se cuantifica entre 0 y 1, donde 0 implica la imposibilidad de que
ocurra, y 1 implica la certeza de que ocurra.

Por ejemplo, si lanzamos una moneda al aire, la posibilidad de que salga cara o sello es de 0,5,
es decir, la mitad, puesto que tenemos dos alternativas. En el caso de un dado, la posibilidad de
que salga la cara con el tres, es de 1/6, es decir, 0,1667. De esta manera, mientras más
alternativas tengamos, menor es la probabilidad de que una de ellas ocurra.

Es lo que ocurre en los casos de los juegos de lotería, donde son tantas las posibilidades y
combinaciones, que la probabilidad de ganar un premio es mínima. Si estamos jugando una rifa,
y sabemos que hay 100 números, de los cuales tenemos 1, nuestra probabilidad de ganar es de
0,01. Si queremos aumentar nuestra probabilidad de ganar, debemos adquirir más números.

Como decíamos anteriormente, las muestras estudiadas se comparan con una distribución
muestral (la curva normal), como un parámetro teórico que ejemplifica una situación “ideal”. En
este sentido, nos interesa que nuestra muestra tenga una distribución similar a la curva normal,
de modo de poder generalizar nuestros resultados a la población (o universo)

¿Cómo se relaciona esto con la probabilidad? Sabemos que la probabilidad va de 0 a 1 y si lo


llevamos a la curva normal, toda el área comprendida por ella, representará el 1, es decir, la
certeza de que un evento X ocurra, pues en la curva normal, están todos los eventos
representados.

De esta forma, podemos comparar, por ejemplo, la media de C.I. de la muestra, con la media
estimada para una curva normal, de modo de establecer cuál es la probabilidad de que ambas
medias sean similares. Si tenemos una probabilidad cercana a 1 de que ambas medias sean
similares, entonces podemos asegurarnos de que los resultados de la muestra son
generalizables a la población. En el caso contrario, no podremos generalizarlos y nuestra
investigación tendrá resultados negativos.

En la práctica, nunca la media de una muestra (o cualquier otra medida) será igual a la media de
la curva normal, por lo que se opta por establecer un “porcentaje de confianza” que reduzca el
error al mínimo.

Veámoslo con un ejemplo anterior. Si nos interesa ganar el premio de la rifa, mientras más
números tengamos, mejor. Suponiendo que no los podemos tener todos (Probabilidad =1),
podríamos adquirir 95, con lo cual tenemos un 95% de confianza de poder ganar el premio
(Probabilidad = 0,95). Si queremos disminuir aún más la posibilidad de perder (error), entonces
compraremos 99 números, con lo cual sólo hay una posibilidad de perder (probabilidad = 0,99).
Como vemos, mientras más cercana a 1, menor es la probabilidad de equivocarse.

Si llevamos esto a la curva normal y a nuestra muestra, para poder generalizar nuestros
resultados debemos disminuir la probabilidad de error. Es decir, asegurarnos en un alto
porcentaje que las medidas obtenidas en la muestra tienen un alto porcentaje de confianza de
acercarse a la medida de la curva normal.

Por convenciones de la comunidad científica, se establecieron ciertos parámetros de confianza,


a lo cual se le denominó significancia. Tales parámetros determinan que para poder generalizar
los resultados de una investigación se puede operar con dos niveles:
- el 95% de confianza, es decir, sólo un 5% de probabilidad de error (significancia = 0,05)
- el 99% de confianza, es decir, sólo un 1% de probabilidad de error (significancia = 0,01)

Se pueden establecer niveles de menor porcentaje de error, pero en ciencias sociales es difícil
obtener resultados generalizables con tanta certeza, debido a la diversidad de la población. En
este sentido, al estudiar seres humanos, nuestras probabilidades de error siempre estarán
presentes.

También podría gustarte