Está en la página 1de 11

CAPITULO 5

DISTRIBUCION DE FRECUENCIAS BIVARIANTES

“Solíamos pensar que si sabíamos lo que significaba uno, sabríamos lo que es dos,
porque uno y uno son dos. Ahora descubrimos que primero debemos aprender mucho
más sobre lo que significa Y.”
Sir Arthur Eddington (1882-1944)

Diremos que tenemos una muestra estadística bidimensional cuando sobre cada elemento
de la muestra se realiza la observación simultánea de dos caracteres. Por ejemplo, una
muestra bidimensional sería una serie de datos sobre altura y presión atmosférica, o la
edad y el peso de un grupo de individuos. Tendremos en este caso una variable
estadística bidimensional, representada por la pareja de símbolos (X, Y) y que en general,
para una muestra de elementos, podrá tomar los valores (𝑋1 ,𝑌1 ) (𝑋2 ,𝑌2 ) (𝑋3 ,𝑌3 ) . . . (𝑋𝑛 ,𝑌𝑛 )
Evidentemente, los caracteres representados por las variables X y Y no tienen por qué ser
del mismo tipo, pudiendo ser cada uno de ellos de tipo cuantitativo o cualitativo. Además
en el caso de ser ambas variables cuantitativas (caso en el que nos concentraremos en
nuestro análisis) cada una de ellas podrá ser continua o discreta. En este capıtulo se
describirá en primer lugar como se puede estudiar la distribución de frecuencias de una
variable bidimensional. Posteriormente se abordara el estudio de cómo se pueden analizar
las posibles relaciones entre los dos caracteres de una variable bidimensional. Hay que
indicar que el estudio de las variables bidimensionales es un caso particular del de las
variables n-dimensionales, el cual se puede abordar con facilidad generalizando el
primero.

Distribuciones de frecuencias de una variable bidimensional

De la misma manera que el análisis de la distribución de frecuencias de una variable


unidimensional constituye un primer paso para la descripción estadística de la muestra, el
estudio de la distribución de frecuencias de una variable bidimensional es de gran utilidad.
Evidentemente este estudio solo tendrá sentido cuando tratemos con una variable discreta
en la que haya repetición de valores o una variable continua agrupada en intervalos.
Tabla de frecuencias de doble entrada

Al igual que en el caso unidimensional, el primer paso para el estudio de la distribución de


frecuencias es la construcción de una tabla de frecuencias. Supongamos que tenemos n
pares de medidas de una variable bidimensional (X,Y). Diremos que dos pares de medidas
serán iguales (o estarán repetidos) cuando coincidan ambas componentes. Supongamos
que X puede tomar los k valores distintos 𝑋1 , 𝑋2 , 𝑋3 , . . . , 𝑋𝑘 y que Y puede tomar h
valores distintos 𝑌1 , 𝑌2 , 𝑌3 , . . . , 𝑌ℎ , donde h no tiene por qué ser igual a k. Para construir
la tabla de frecuencias habrá que contabilizar el número de veces que cada par distinto de
la variable bidimensional aparece repetido, ordenándose dichos valores en la llamada
tabla de frecuencias de doble entrada, donde en las ordenadas se escriben los diferentes
valores de X y en abscisas los valores de Y:

𝑌𝑗
𝑋𝑖 Total
𝑌1 𝑌2 . . . 𝑌𝑗 . . . 𝑌ℎ
𝑋1 𝑛11 𝑛12 . . . 𝑛1𝑗 . . . 𝑛1ℎ ∑ℎ1 𝑛1𝑗
𝑋2 𝑛21 𝑛22 . . . 𝑛2𝑗 . . . 𝑛2ℎ ∑ℎ1 𝑛2𝑗
. . . . . .
. . . . . .
. . . . . .
𝑋𝑖 𝑛𝑖1 𝑛𝑖2 . . . 𝑛𝑖𝑗 . . . 𝑛𝑖ℎ ∑ℎ1 𝑛𝑖𝑗
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
𝑋𝑘 𝑛𝑘1 𝑛𝑘2 . . . 𝑛𝑘𝑗 . . . 𝑛𝑘ℎ ∑ℎ1 𝑛𝑘𝑗
Total ∑ℎ1 𝑛𝑖1 ∑ℎ1 𝑛𝑖2 . . . ∑ℎ1 𝑛𝑖𝑗 . . . ∑ℎ1 𝑛𝑖ℎ n

En esta tabla 𝑛𝑖𝑗 es la frecuencia absoluta conjunta, o número de veces que se repite el
par (𝑋𝑖 ,𝑌𝑗 ). De la misma forma se podría construir una tabla de frecuencias relativas
𝑛𝑖𝑗
escribiendo los valores ℎ𝑖𝑗 , definidos como ℎ𝑖𝑗 =
𝑛

Al igual que ocurre en las variables unidimensionales se cumplen las propiedades:


𝑛𝑖𝑗 ∑∑𝑛𝑖𝑗
∑∑𝑛𝑖𝑗 = n ; ∑∑ℎ𝑖𝑗 = ∑∑ 𝑛 = =1
𝑛
Ejemplo.- Mediante una encuesta realizada en una determinada localidad se obtuvo los
siguientes datos correspondientes al ingreso semanal (X en dólares) y gasto en consumo
también semanal (Y en dólares) de una muestra de 25 hogares. Elaborar la distribución de
frecuencias conjunta.
X: 80 90 85 60 70 95 85 100 160 65 88 73 78 90 140
Y: 65 75 75 70 65 80 80 88 150 65 66 70 68 75 100
X: 165 168 170 165 110 160 180 200 220 150
Y: 120 125 130 100 90 110 150 140 150 110

En primer lugar se determina la amplitud de clase para cada una de las dos variables
como sigue:
𝑅 𝑋 −𝑋 220−70 𝑅 𝑌 −𝑌 150−60
𝐶𝑋 = 𝑋𝑛 = 𝑚𝑎𝑥 𝑚𝑖𝑛 = 5 = 30$; 𝐶𝑌 = 𝑌𝑛 = 𝑚𝑎𝑥 𝑚𝑖𝑛 = 5 = 18$.
√ √25 √ √25

Con los datos anteriores se elabora la distribución de frecuencias absolutas bidimensional;


la cual, es la siguiente:

Ingreso Gasto semanal


TOTAL
semanal 60 – 78 78 - 96 96 - 114 114 - 132 132 – 150
70 - 100 10 2 12
100 - 130 2 2
130 - 160 2 2
160 - 190 2 3 2 7
190 - 220 2 2
TOTAL 10 4 4 3 4 25

La interpretación de las frecuencias absolutas conjuntas (las más significativas) de la tabla


anterior es la siguiente:
 10 de los 25 hogares tienen ingreso semanal comprendido entre 70 y 100 $, cuyos
gastos varían entre 60 y 78 $.
 3 de los 25 hogares tienen ingresos comprendidos entre 160 y 190 $, cuyos gastos
varían entre 114 y 132 $.
 Etc.
La interpretación de algunas frecuencias absolutas marginales (totales de la última fila) es
la siguiente:
 10 de los 25 hogares tienen gasto semanal comprendido entre 60 y 78 $. Pero no
se conoce sus montos de ingreso.
 4 de los 25 hogares tienen ingreso semanal comprendido entre 78 y 96 $; pero no
se conoce sus montos de ingreso.
 Etc.
La interpretación de algunas de las frecuencias absolutas marginales (totales de la
última columna) es la siguiente:
 12 de los 25 hogares tienen ingreso semanal comprendido entre 70 y 100 $;
pero no se conoce sus montos de gasto.
 7 de los 25 hogares tienen ingreso semanal comprendido entre 160 y 190$; pero
no se conoce sus montos de gasto.
 Etc.

Distribuciones de frecuencias marginales

A veces es interesante analizar cuantas veces se repite un cierto valor de X sin tener en
cuenta para nada a los posibles valores de Y, o viceversa. Para estudiar cada una de las
componentes de la variable bidimensional aisladamente de la otra se definen las
frecuencias marginales 𝑛𝑥𝑖 y 𝑛𝑦𝑗 como: 𝑛𝑥𝑖 = ∑ℎ𝑗=1 𝑛𝑖𝑗 , y 𝑛𝑦𝑗 = ∑𝑘𝑖=1 𝑛𝑖𝑗 . De esta forma, 𝑛𝑥𝑖
representa el número de veces que X toma el valor 𝑋𝑖 , independientemente de los
posibles valores de Y, y lo mismo para 𝑛𝑦𝑗 .

A la distribución formada por los diferentes valores de X y sus frecuencias marginales se le


llama distribución marginal de X. Normalmente las frecuencias marginales de X y de Y se
escriben respectivamente en la última columna y fila de la tabla de frecuencias de doble
entrada. Su cálculo es muy sencillo ya que basta con sumar las correspondientes
frecuencias conjuntas de cada fila y columna.
𝑛
De la misma manera se pueden definir las frecuencias relativas marginales como: ℎ𝑥𝑖 = 𝑥𝑖
𝑛
𝑛𝑦𝑗
y ℎ𝑦𝑖 = 𝑛

Algunas propiedades evidentes son: ∑𝑘1 𝑛𝑥𝑖 = n; ∑ℎ1 𝑛𝑦𝑗 = n; ∑𝑘1 ℎ𝑥𝑖 = 1 y ∑ℎ1 ℎ𝑦𝑗 = 1

Para caracterizar estas distribuciones marginales se pueden definir sus medias y


2
∑𝑘
1 𝑋𝑖 𝑛𝑥𝑖
∑ℎ
1 𝑌𝑗 𝑛𝑦𝑗 ∑(𝑋𝑖−𝑋̅ )2 𝑛𝑥𝑖 ∑(𝑌𝑗 −𝑌̅) 𝑛𝑦𝑗
varianzas como: 𝑋̅ = ; 𝑌̅ = ; 𝑆𝑋2 = y 𝑆𝑌2 = , y las
𝑛 𝑛 𝑛 𝑛

desviaciones estándar son las correspondientes raíces cuadradas de las varianzas.

Hay que indicar que al evaluar las frecuencias marginales se está perdiendo información,
ya que se obvian las distribuciones en la otra parte de la variable. Es más, el análisis de
ambas distribuciones marginales no proporciona tanta información como la tabla de
frecuencias conjunta.

Ejemplo.- Las distribuciones de frecuencias marginales y sus correspondientes


estadígrafos descriptivos más importantes son las siguientes:
Distribución marginal del ingreso semanal (X en dólares)

Ingreso 𝒏𝒙𝒊 𝑿𝒊 𝑿𝒊 𝒏𝒙𝒊 ̅ )𝟐 𝒏𝒙𝒊


(𝑿 𝒊 − 𝑿 ̅ )𝟑 𝒏𝒙𝒊
(𝑿 𝒊 − 𝑿 ̅ )𝟒 𝒏𝒙𝒊
(𝑿 𝒊 − 𝑿

70 - 100 12 85 1.020 21.168 -889.056 37.340.352


100 - 130 2 115 230 288 -3.456 41.472
130 - 160 2 145 290 648 11.664 209.952
160 - 190 7 175 1.225 16.128 774.144 37.158.912
190 - 220 2 205 410 12.168 949.104 74.030.112
TOTAL 25 3.175 50.400 842.400 148.780.800

3.175 50,400
Media aritmética: 𝑋̅ = = 127$; Varianza: 𝑆𝑋2 = = 2.016 $2 ; Desviación Estándar:
25 25
842.400
𝑆𝑋 = √2.016 = 44,90$; Tercer Momento Centrado respecto a la media: 𝑀3 = =
25
148.780.800
33.696; Cuarto Momento Centrado respecto a la media: 𝑀4 = = 5.951.232;
25
33.696 5.951.232
Coeficiente de Asimetría: 𝐶𝐴3 = (44,9)3
= 0,37; Coeficiente de Curtosis: 𝐶𝐶4 = (44,9)4
=

1,46.

Por la información anterior, se establece que la distribución marginal del ingreso semanal
de la muestra de 25 hogares, presenta leve sesgo positivo y es mucho más aplanada que
la distribución normal.

Distribución marginal del gasto semanal (Y en dólares)


𝟒
Gasto 𝒏𝒚𝒋 𝒀𝒋 ̅ )𝟐 𝒏𝒚𝒋 (𝒀𝒋 − 𝒀
𝒀𝒋 𝒏𝒚𝒋 (𝒀𝒋 − 𝒀 ̅ )𝟑 𝒏𝒚𝒋 ̅ ) 𝒏𝒚𝒋
(𝒀𝒋 − 𝒀
60 - 78 10 69 690 7.096,9 -189.061,3 5.036.593,3
78 - 96 4 87 348 298,6 -2.579,9 22.290,3
96 - 114 4 105 420 350,4 3.280,1 30.701,8
114 - 132 3 123 369 2.245,7 61.442,6 1.681.069,3
132 - 150 4 141 564 8.230,1 373.318,2 16.933.712,2
TOTAL 25 2.391 18.221,8 246.399,7 23.704.366,9

2.391 18.221,8
Media aritmética: 𝑌̅ = = 95,64$; Varianza: 𝑆𝑌2 = = 728,87$2 ; Desviación
25 25

Estándar: 𝑆𝑌 = √728,87 = 27$; Tercer Momento Centrado respecto a la media: 𝑀3 =


246.399,7 23.704.366,9
= 9.855,99; Cuarto Momento Centrado respecto a la media: 𝑀4 = =
25 25
9.855,99
948.174,68; Coeficiente de Asimetría: 𝐶𝐴3 = (27)3
= 0,50; Coeficiente de Curtosis: 𝐶𝐶4 =
948.174,68
(27)4
= 1,78.

Por la información anterior, se establece que la distribución marginal del gasto semanal de
la muestra de 25 hogares, como en el caso anterior presenta también leve sesgo positivo y
es mucho más aplanada que la distribución normal.

Distribuciones de frecuencias condicionadas

En muchos casos es importante conocer la distribución de la variable X para todos


aquellos pares de datos en los que la variable Y toma un cierto valor 𝑌𝑗 . Es decir, al
contrario que en las distribuciones marginales en que no importaba el valor que tomase la
otra variable, ahora se fija dicho valor. A este conjunto de valores que puede tomar la
variable X para un cierto valor 𝑌𝑗 de Y se le denomina distribución de X condicionada a Y =
𝑌𝑗 y las correspondientes frecuencias absolutas se representan por n(𝑋𝑖 /𝑌 = 𝑌𝑗 ), cuyo
significado es, entonces, el número de veces que aparece repetido el valor 𝑋𝑖 entre
aquellos pares de datos que tienen Y = 𝑌𝑗 .

De la misma forma se puede definir la distribución de Y condicionada a X = 𝑋𝑖 . Los valores


de estas frecuencias absolutas condicionadas pueden extraerse directamente de la tabla
de doble entrada, ya que es claro que: n(𝑋𝑖 /𝑌 = 𝑌𝑗 ) = 𝑛𝑖𝑗 y n(𝑌𝑗 /𝑋 = 𝑋𝑖 ) = 𝑛𝑖𝑗 . Es decir, la
tabla de frecuencias para la distribución de X condicionada a Y = 𝑌𝑗 es:

𝑋𝑖 n(X/Y=𝑌𝑗 ) h(X/Y=𝑌𝑗 )
𝑋1 𝑛1𝑗 ℎ1𝑗
𝑋2 𝑛2𝑗 ℎ2𝑗
. . .
. . .
. . .
𝑋𝑖 𝑛𝑖𝑗 ℎ𝑖𝑗
. . .
. . .
. . .
𝑋𝑘 𝑛𝑘𝑗 ℎ𝑘𝑗
Total n 1

Para calcular las frecuencias relativas de X condicionadas a Y = 𝑌𝑗 habrá que dividir por el
número de datos que tienen Y = 𝑌𝑗 , es decir por la frecuencia marginal de 𝑌𝑗 (𝑛𝑦𝑗 ), que son:
𝑛(𝑋𝑖 /𝑌=𝑌𝑗 ) 𝑛𝑖𝑗 𝑛(𝑌𝑗 /𝑋=𝑋𝑖 ) 𝑛𝑖𝑗
h(𝑋𝑖 /Y=𝑌𝑗 ) = = 𝑛 ; y h(𝑌𝑗 /X =𝑋𝑖 ) = =𝑛
𝑛𝑦𝑗 𝑦𝑗 𝑛𝑥𝑖 𝑥𝑖
Como es fácil de comprobar, se cumplen las siguientes igualdades: ∑𝑘1 𝑛(𝑋𝑖 /𝑌 = 𝑌𝑗 ) = 𝑛𝑦𝑗 ;
∑ℎ1 𝑛(𝑌𝑗 /𝑋 = 𝑋𝑖 ) = 𝑛𝑥𝑖 ; ∑𝑘1 ℎ(𝑋𝑖 /𝑌 = 𝑌𝑗 ) = 1; y ∑ℎ1 ℎ(𝑌𝑗 /𝑋 = 𝑋𝑖 ) = 1

Ejemplo.- Distribución de frecuencias del ingreso (X) con la condición de que el gasto (Y)
se encuentra comprendido entre 60 y 96$

Gasto
Ingreso TOTAL
60 - 78 78 - 96
70 - 100 10 2 12
100 – 130 2 2
130 – 160 0
160 – 190 0
190 – 220 0
TOTAL 10 4 14

Ejemplo.- Distribución de frecuencias del gasto (Y) con la condición de que el ingreso (X)
se encuentra entre 160 y 220$

Gasto
Ingreso TOTAL
60 - 78 78 - 96 96 - 114 114 - 132 132 - 150
160 - 190 2 3 2 7
190 - 220 2 2
TOTAL 0 0 2 3 4 9

Representaciones graficas

Al igual que para las variables unidimensionales, existen diversas formas de representar
gráficamente los datos de una muestra bidimensional de forma que se pueda obtener una
idea rápida de cómo se distribuyen los valores.

En el caso de variables discretas con repeticiones de valores y de datos agrupados en


intervalos, los diagramas más usuales son los diagramas de barras e histogramas
tridimensionales. Para ello se dibuja en perspectiva un plano XY donde se marcan los
valores de la variable y se levanta, en el caso del diagrama de barras (para variables
discretas), sobre cada par una barra de altura proporcional a la frecuencia.

El histograma, para variables agrupadas en intervalos, se construye sustituyendo las


barras por paralelepípedos solapados. En general se hace que los volúmenes de los
paralelepípedos sean proporcionales a las frecuencias de cada intervalo o, para intervalos
de amplitud constante y de forma más sencilla, con alturas proporcionales a las
frecuencias.
Cuando no existen valores repetidos y no se hace agrupamiento por intervalos, la
representación se hace sobre un diagrama de dispersión. Este diagrama bidimensional se
construye dibujando para cada par (X, Y) un punto sobre un plano cartesiano. Como se
verá posteriormente, este diagrama permite examinar de forma rápida si puede haber
alguna relación entre las dos partes de la variable bidimensional.

La Covarianza.- Es una medida de la forma como varían juntas las dos variables, cuya
definición es la media aritmética del producto de los desvíos de los valores de ambas
variables respecto a sus correspondientes medias aritméticas; o sea:
∑∑[(𝑋𝑖 −𝑋̅)(𝑌𝑗 −𝑌̅)]𝑛𝑖𝑗 ∑∑𝑋𝑖 𝑌𝑗𝑛𝑖𝑗
𝑆𝑋𝑌 = = - 𝑋̅ 𝑌̅
𝑛 𝑛
Por la segunda expresión, la covarianza podrá ser positiva, negativa o nula:
i) Si es positiva, esto significa que ambas varían en la misma dirección; es decir, cuando
una se incrementa la otra también se incrementa, un ejemplo de este tipo de variación es
cuando se relaciona el gasto en consumo con el ingreso disponible de un conjunto de
hogares; es decir, cuando se incrementa el ingreso disponible, se incrementa el gasto o
viceversa.
ii) Si la covarianza es negativa, esto indica que cuando una de las variables se incrementa,
la otra disminuye, o viceversa; un ejemplo típico es cuando se relaciona la cantidad de
demanda de un bien o servicio con su precio unitario; es decir, cuando sube su precio
unitario, disminuye la cantidad de demanda y cuando baja el precio unitario sube la
cantidad de demandada.
iii) La covarianza es nula cuando los dos términos de la segunda ecuación anterior son
iguales. En este caso, se dice que las variables son independientes.

∑∑𝑋𝑖 𝑌𝑗 𝑛𝑖𝑗 332.385


𝑆𝑋𝑌 = - 𝑋̅𝑌̅ = 25 - (127)(95,64) = 13.295,4 – 12.146,3 = 1.145,10$𝑢𝑠 2
𝑛
𝑿𝒊 𝒀𝒋 𝒏𝒊𝒋 𝑿𝒊 𝒀𝒋 𝒏𝒊𝒋
85 69 10 58.650
85 87 2 14.790
115 87 2 20.010
145 105 2 30.450
175 105 2 36.750
175 123 3 64.575
175 141 2 49.350
205 141 2 57.810
TOTAL 25 332.385

La covarianza para el ejemplo de ingresos y gastos semanales de la muestra de 25


hogares, resulta 1.145.10$2

El Coeficiente de Correlación

Un estadígrafo adimensional de la forma como varían juntas dos variables, se denomina


Coeficiente de Correlación, que por definición está dado como sigue:

𝑆 𝑛 ∑ 𝑋𝑖 𝑌𝑖 −(∑ 𝑋𝑖 )(∑ 𝑌𝑖 )
r = 𝑆 𝑋𝑌 =
𝑆
𝑋 𝑌 2
√[𝑛 ∑ 𝑋𝑖2 −(∑ 𝑋𝑖 ) ][𝑛 ∑ 𝑌𝑖2 −(∑ 𝑌𝑖 )2 ]

El valor de este coeficiente se encuentra entre 0 y 1; por lo que, mide el grado de


correlación o el grado de dependencia existente entre las dos variables.

 Cuando el valor de r se encuentra cerca de +1, esto significa la existencia de alta


dependencia directa entre las dos variables; es decir, cuando X se incrementa en
una magnitud, la otra variable (Y) se incrementa de una forma importante.

 Cuando el valor de r se encuentra cerca de -1, esto significa la existencia de alta


dependencia inversa entre las dos variables; es decir, cuando X se incrementa en
una magnitud la otra variable (Y) disminuye de una forma importante, pero en forma
inversa.

 Cuando el valor de r se encuentra cerca de cero, se dice que la correlación o


dependencia de ambas variables es baja.

 Cuando el valor de r es igual a cero se dice que las dos variables son
independientes.
El Coeficiente de Correlación para el ejemplo de ingresos y gastos semanales de la
1.145,10$2 1.145,1
muestra de 25 hogares resulta: 𝑟𝑥𝑦 = (44,9$)(27$)
= = 0,955. Debido a que este
1.212,3
resultado es próximo a la unidad, esto quiere decir que existe alta correlación o
dependencia positiva entre el ingreso y el gasto en consumo; es decir, cuando se
incrementa el ingreso disponible, se incrementa el gasto en consumo.

Problemas para resolver

1. Una compañía realiza un estudio de la relación entre el tiempo de servicio (X en años)


de un cierto tipo de máquinas y el gasto anual en mantenimiento y reparaciones (Y en
miles de Bs.) de esas máquinas. Los datos obtenidos se muestran en la siguiente tabla:

X
1–5 5–9 9 – 13
Y
10 – 30 10 3 4
30 – 50 0 8 7
50 – 70 0 0 5
70 – 90 0 0 13

a) Hallar el gasto medio para el conjunto de las máquinas, b) Hallar el tiempo medio de
servicio de las máquinas, c) Hallar las varianzas marginales, la covarianza y el coeficiente
de correlación.

2. Una empresa realiza un estudio de la relación entre el número de accidentes por año
(X) de los trabajadores y la edad (Y en años) de los mismos. Los resultados se muestran
en la siguiente distribución de frecuencias bidimensional:

X
0 1 2 3
Y
17 – 21 20 15 25 30
21 – 41 5 20 0 0
41 - 61 5 0 0 0

Calcular los siguientes estadígrafos descriptivos: a) La edad media para el conjunto de los
trabajadores, b) El número medio de accidentes de los trabajadores, c) Las varianzas y las
desviaciones estándar marginales y el coeficiente de correlación, d) La edad media y la
desviación estándar para los trabajadores sin ningún accidente.

3. Mediante una encuesta realizada en una determinada localidad se obtuvo los siguientes
datos correspondientes al ingreso semanal (X en dólares) y gasto en consumo también
semanal (Y en dólares) de una muestra de 36 hogares, a) Elaborar la distribución de
frecuencias bidimensional, b) Elaborar las distribuciones de frecuencias marginales, c)
Elaborar las medias y las desviaciones estándar marginales, d) Calcular la covarianza e
interpretar su resultado, e) Calcular el coeficiente de correlación e interpretar su resultado.
X: 80 90 85 70 70 95 85 100 160 65 88 130
Y: 60 75 75 70 60 65 80 88 150 65 66 70
X: 165 168 170 165 110 160 180 200 220 150 120 110
Y: 120 125 130 100 90 110 150 140 150 110 95 110
X: 78 90 140 90 115 125 140 130 100 148 200 160
Y: 68 75 100 110 90 120 80 110 120 130 130 110

4.- En un centro médico de la ciudad de La Paz, el número de consultas médicas por


semana realizada en medicina general (Y) y la edad de los pacientes (X en años) se
relacionan según la información presentada en la siguiente distribución de frecuencias
bidimensional:

X
21 - 31 31 - 41 41 - 51 51 - 61 61 – 71
Y
1 4 - - - -
2 5 - - - -
3 - 3 4 - -
4 - 3 6 5 6
5 - - - 6 8

a) Elaborar las distribuciones de frecuencias marginales, b) Calcular las medias y las


desviaciones estándar marginales, c) Calcular la covarianza y el coeficiente de correlación
entre las dos variables, d) La correlación entre las dos variables es directo o inverso.

5. Para la siguiente distribución de frecuencias absolutas, referida a la edad de la madre


(X en años) y el número de hijos (Y) de una muestra de 50 hogares:

X
10 - 20 20 - 30 30 – 40 40 – 50
Y
0 2 6 - -
1 2 8 6 -
2 - 6 5 6
3 - - 5 2
4 - - 2 -

Determinar: a) La proporción de hogares con hasta 3 hijos, b) El porcentaje de hogares


cuya edad de las madres es menor a 20 años, Qué proporción de hogares tienen madres
con edad mayor a 37 años.

También podría gustarte