Documentos de Académico
Documentos de Profesional
Documentos de Cultura
I. DATOS GENERALES:
Introducción: Hasta ahora hemos estudiado el comportamiento de una sola característica o variable estadística que
hemos medido en un conjunto de elementos que formaban una población estadística o una muestra representativa
de la misma. Pero podemos estudiar para cada elemento de la población dos o más características de tipo
cualitativo o cuantitativo. Lo habitual es que se estudien al mismo tiempo varias características de los elementos de
una población estadística Consideremos, por ejemplo, que nuestro objetivo es estudiar las causas que originan los
distintos niveles de los gastos de los individuos varones mayores de 18 años de la UNAN - León. Además de esta
1
UNIVERSIDAD NACIONAL AUTÓNOMA DE NICARAGUA
“A la Libertad por la Universidad”
VICERRECTORÌA ACADÈMICA
variable, que normalmente se medirá en una muestra representativa de la población estadística, nos interesará
medir otras características que están relacionadas con ella: ingresos del individuo, estado civil, aficiones que tiene,
la edad.
Todas estas características influirán en los niveles de gastos y nos podrán explicar su comportamiento. En general, a
mayores ingresos existirá un mayor gasto. Podrá estudiarse separadamente cada característica construyendo su
distribución unidimensional pero lo normal es presentar conjuntamente más de una característica con el objetivo de
estudiar sus posibles relaciones y responder a cuestiones como las siguientes: ¿en qué medida el nivel de ingresos
determina el nivel de gastos?, ¿existe relación entre el nivel de gastos y la edad?, ¿y el estado civil?, etc. Estudiarán
las distintas tabulaciones de las variables estadísticas bidimensionales y los nuevos conceptos que generan
(distribuciones de frecuencias marginales y condicionadas), el concepto de independencia estadística y correlación
entre variables.
Tablas de correlación: Partimos de una población estadística en la que se estudian simultáneamente dos variables o
características cuantitativas que nos definen una variable estadística bidimensional. Llamando X e Y a las variables
consideradas, podemos construir la llamada tabla de correlación. Los datos en que se presenta la variable X i, los
denotamos Xi (i = 1, 2, ... r). Los datos en que se presenta la variable Y, los denotamos yj ( j = 1,2. .... c), sea nij la
frecuencia absoluta con que se presenta el par simultáneo (Xi ,Yj ), la distribución conjunta o bidimensional se dá en
esta tabla:
Tabla de Correlación
Así el número de unidades en la población es n.. = N, y las X Y
y1 y2 ... yj . . . yc ni.
frecuencias marginales son ni. por fila y n.j por columna, con x1 n11 n12 ... n1j . . . n1c n1.
estas se construyen la última fila y la última columna de la tabla x2 n21 n22 ... n2j . . . n2c n2.
de correlación; una variable al margen de la otra. El número de ... … … … … …
filas es r y el número de columnas es c. Las frecuencias totales y .xt ni1 ni2 ... nij . . . nic ni.
marginales son: ... … … … … …
xr nr1 nr2 ... nrj . . . nrc nr.
n.j n.1 n.2 . . . n.j . . . n.c N
Puede construirse una Tabla de distribución de Frecuencias Relativas, al dividir cada frecuencia absoluta por el total
de observaciones N: fij = nij/N. Es inmediato comprobar que la suma de todas las frecuencias relativas es la unidad.
Las frecuencias marginales relativas serán: fi. = ni. /N ; f.j = n.j /N ⇒ Σ fij = 1.
Las tablas de correlación se construyen cuando el número de observaciones es elevado y existe también un elevado
número de pares de valores (Xi , Yj ) en los que i = j ó i ≠ j. También por conveniencia, para hacer la distribución más
manejable, se puede agrupar los valores de las variables en intervalos de clases con lo que los respectivos (Xi , Yj )
que serían las correspondientes marcas de clase.
Se observa que de las 100 familias sólo hay 15 en las que el dinero lo aporta una sola persona y sus ingresos están
comprendidos entre 10000 y 15000 córdobas; 30 familias en las que los ingresos los aportan dos personas,
comprendidos estos, entre 20000 y 30000 córdobas, y así se interpretan en lo sucesivo las frecuencias absolutas
conjuntas nij. Las frecuencias marginales ni. y n.j nos señalan el número de veces que se repiten los valores de X y Y
por separado sin que se establezca entre ellas ninguna relación conjunta. Así de las 100 familias 38 tienen un sólo
miembro que ingresa dinero al núcleo familiar; 54 con dos miembros y 8 familias con tres miembros que aportan. Al
observar los niveles de ingresos representados por Xi vemos que 18 familias están en el nivel de ingresos más bajo,
32 en el segundo nivel, 46 en el tercer nivel y sólo 4 familias pertenecen al nivel de mayores ingresos. ¿Qué
porcentaje de familias tiene ingreso entre 15 y 30 mil córdobas mensualmente?
Tabla de correlación de frecuencias relativas
A partir de la Tabla anterior obtener la tabla de correlación de
Ingreso Miembros que aportan ( yj )
frecuencias relativas. Resulta simple la división de cada
Xi 1 2 3 fi.
frecuencia conjunta absoluta por el total de familias N=100, y
12500 0.15 0.02 0.01 0.18
los valores de frecuencias solo cambian de dimensión.
17500 0.10 0.20 0.02 0.32
Comprobar que la suma de todas las frecuencias relativas es la
25000 0.12 0.30 0.04 0.46
unidad. Se sondea que solo el 8% de las familias tienen hasta
40000 0.01 0.02 0.01 0.04
tres miembros aportando, mientras que el 92% de las familias
no más de dos miembros aportando. f .j 0.38 0.54 0.08 1
Tabla de correlación simple: Cuando existen pocas observaciones y las frecuencias son unitarias no tiene sentido
construir una tabla de correlación ya que muchas de las celdas de las frecuencias xi x1 x2 … xi … xr
absolutas serían cero. En este caso, la distribución bidimensional es simplemente yi y1 y2 … yi … yr
dos columnas o dos filas a como se muestra en la tablita derecha.
Así, por ejemplo el valor de la producción anual (xi) expresado en xi 1,500 2,500 5,000 10,000 15,000
millones de córdobas y el número de trabajadores (yj) de cinco yi 350 500 800 1,500 1,700
empresas del sector de la construcción, se tabula de la forma siguiente
en la tabla derecha:
Expresadas ambas en formato de filas, la distribución marginal de frecuencias para cada variable sería:
xi x1 x2 … xi … xr Total yi y1 y2 … yj … yc Total
ni. n1. n2. … ni. … nr. N n.j n.1 n.2 … n.j … n.c N
De estas distribuciones marginales, como en esencia son distribuciones unidimensionales ya que expresan el estudio
de cada variable con independencia de la otra, pueden obtenerse todas las medidas de posición, dispersión, etc. que
3
UNIVERSIDAD NACIONAL AUTÓNOMA DE NICARAGUA
“A la Libertad por la Universidad”
VICERRECTORÌA ACADÈMICA
se han estudiado en la unidad previa de las variables unidimensionales (medias marginales, varianzas marginales,
etc.).
Puede observarse que pueden definirse tantas distribuciones de frecuencias condicionadas como valores tienen las
variables X e Y ya que cada una queda determinada por la fila o la columna del correspondiente valor que
condiciona. Las distribuciones condicionadas también son unidimensionales y por tanto puede obtenerse todas las
medidas de posición y dispersión de las mismas.
4
UNIVERSIDAD NACIONAL AUTÓNOMA DE NICARAGUA
“A la Libertad por la Universidad”
VICERRECTORÌA ACADÈMICA
Este coeficiente nos indica, expresado en tantos por 100, que la desviación típica supone un 32% de la media
aritmética con lo que podemos admitir como promedio que nos representa al conjunto de la distribución. Hasta un
50% de participación de la dispersión en el promedio se considera como aceptable la representatividad.
Independencia estadística: Dos variables estadísticas X e Y son independientes entre sí cuando la variación de una
de ellas no influye en la distribución de la otra condicionada por el valor que tome la primera. Por el contrario
existirá dependencia cuando los valores de una condicionan la distribución de los valores de la otra.
Definición: Dadas las variables estadísticas X e Y, la condición necesaria y suficiente para que sean independientes
es:
Una propiedad de interés es que si X e Y son independientes, entonces la covarianza entre ellas es nula. Sin
embargo, que Cov(X,Y) = 0, no implica que X y Y sean independientes.
Ejemplo 4: La tabla de correlación presentada en el Ejemplo 1, probar si las variables X e Y son dependientes,
veamos:
La independencia estadística entre X y Y. exige que para todo i=1,2,3,4 y todo j=1,2,3; se verifique n ij/N =
(ni./N)*(n.j/N). Como esto no se da para algún par (i, j), concretamente para i = 2 y j = 1, concluimos que X y Y son
dependientes.
Evaluación del aprendizaje: Realizar en parejas el ejercicio ToothGrowth (40 minutos): El efecto de la vitamina C
sobre el crecimiento de diente en 60 conejillos de indias, se fijó la dosis de vitamina C en tres niveles [0.5, 1.0, 2.0]
miligramos por día, de dos fuentes distintas (jugo de naranja, ácido ascórbico), y se mide al final del experimento la
longitud de los odontoblastos (células responsables del crecimiento del diente), suponga estos en micras de
milímetros. A continuación se presenta el conjunto de datos y se genera el diagrama de cajas comparativo por
fuente de vitamina C.
Dosi Longitud según fuente = Vitamina C Dosis Longitud según fuente = Jugo de Naranja
s
0.5 04.2 11.5 07.3 05.8 06.4 10.0 11.2 11.2 05.2 07.0 0.5 15.2 21.5 17.6 09.7 14.5 10.0 08.2 09.4 16.5
09.7
1.0 16.5 16.5 15.2 17.3 22.5 17.3 13.6 14.5 18.8 15.5 1.0 19.7 23.3 23.6 26.4 20.0 25.2 25.8 21.2 14.5
27.3
2.0 23.6 18.5 33.9 25.5 26.4 32.5 26.7 21.5 23.3 29.5 2.0 25.5 26.4 22.4 24.5 24.8 30.9 26.4 27.3 29.4
23.0
5
UNIVERSIDAD NACIONAL AUTÓNOMA DE NICARAGUA
“A la Libertad por la Universidad”
VICERRECTORÌA ACADÈMICA
Crecimiento de Dientes, Guinea Pigs'
30
Longitud diente
20
5 10
AcidoAscorbico
JugoNaranja
0
0.5 0.5 1 1 2 2
c. Actividades Finales:
Resumir lo expuesto durante la clase y presentación de los ejercicios resueltos por cada
grupo.
d. Orientación del Trabajo independiente:
Realizar ejercicio el cual los estudiantes puedan construir e interpretar tablas correlación.
V. MEDIOS O RECURSOS DIDÁCTICOS NECESARIOS: Pizarra. Marcador. Data show. Una portátil.
Asistencia y participación
VII. CONCLUSIONES:
6
UNIVERSIDAD NACIONAL AUTÓNOMA DE NICARAGUA
“A la Libertad por la Universidad”
VICERRECTORÌA ACADÈMICA
Indagar la importancia de las construcción e interpretación de tablas de correlación
VIII. RECOMENDACIONES:
aprendido.
IX. BIBLIOGRAFIA:
Casas Sánchez José M, Santos Peñas Julián (2002). Introducción a la Estadística para
Economía. Segunda Edición. Editorial Centro de Estudios Ramón Areces, S.A. Madrid, España.