Está en la página 1de 27

Tablas de Doble Entrada

Distribuciones Marginales
Distribuciones Condicionales
Covarianza y Correlación

Estadı́stica Descriptiva Bivariada.

Clase II.

Departamento de Estadı́stica
Facultad de Ciencias Fı́sicas y matemáticas
Universidad de Concepción
Prof: Marı́a José Alejandra Medina Fritz

27 de marzo de 2023

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales
Estructura
Distribuciones Condicionales
Covarianza y Correlación

TABLAS DE DOBLE ENTRADA

También, llamadas tablas de contingencia.

Comportamiento simultáneo de 2 variables, con el propósito de determi-


nar si existe o no alguna relación de dependencia lineal entre ellas.

Formadas en las filas por categorı́as o valores que toma una de las va-
riables, y en las columnas por los valores que toma la otra variable.

En cada casilla se indica las frecuencias absolutas o no de elementos que


reunen en conjunto los valores de la variable.

Las reglas de agrupación son las mismas que en el caso unidimensional.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales
Estructura
Distribuciones Condicionales
Covarianza y Correlación

EJEMPLOS

Ejemplos de Aplicación
1 Determinar si el consumo de un producto depende del ingreso del grupo
familiar.

2 Determinar cuál o cuáles son los mejores dı́as de la semana para pros-
pectar a un cliente.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales
Estructura
Distribuciones Condicionales
Covarianza y Correlación

EJEMPLOS

Ejemplos de Aplicación
1 Determinar si el consumo de un producto depende del ingreso del grupo
familiar.

2 Determinar cuál o cuáles son los mejores dı́as de la semana para pros-
pectar a un cliente.

3 Determinar si las ventas en miles de pesos de un producto depende de


los gastos en publicidad.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales
Estructura
Distribuciones Condicionales
Covarianza y Correlación

EJEMPLOS

Ejemplos de Aplicación
1 Determinar si el consumo de un producto depende del ingreso del grupo
familiar.

2 Determinar cuál o cuáles son los mejores dı́as de la semana para pros-
pectar a un cliente.

3 Determinar si las ventas en miles de pesos de un producto depende de


los gastos en publicidad.

4 Determinar el N o de intentos promedio que tiene un vendedor tiene


relación con llegar a un potencial cliente.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales
Estructura
Distribuciones Condicionales
Covarianza y Correlación

EJEMPLOS

Ejemplos de Aplicación
1 Determinar si el consumo de un producto depende del ingreso del grupo
familiar.

2 Determinar cuál o cuáles son los mejores dı́as de la semana para pros-
pectar a un cliente.

3 Determinar si las ventas en miles de pesos de un producto depende de


los gastos en publicidad.

4 Determinar el N o de intentos promedio que tiene un vendedor tiene


relación con llegar a un potencial cliente.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales
Estructura
Distribuciones Condicionales
Covarianza y Correlación

Estructura de una Tabla de doble entrada

Clase variable X
XX VX
XXX x1 x2 ... xn−1 xn Total
VY X
X
Clase variable Y

y1 n11 n12 ... n1(n−1) n1n n1


y2 n21 n22 ... n2(n−1) n2n n2
. . . .
. . . .
. . ... . .
. . . .
. . . .
. . ... . .
yr−1 n(r−1)1 n(r−1)2 ... n(r−1)(n−1) n(r−1)n n(r−1)
yr nr1 nr2 ... nr(n−1) nrn nr
Total n1 n2 ... n(n−1) nn n

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales
Estructura
Distribuciones Condicionales
Covarianza y Correlación

EJEMPLO

Se quiere observar la relación que existe entre el número de horas diarias que
utiliza un vendedor en linkedin (X) y el ingreso obtenido semanalmente, en
millones de pesos (Y )

Variable N o de Horas X
XX
XXX Horas
Ingreso XXX 2 3 4 5
X
[1 - 2[ 2 1 1 0
V. Ingreso Y

[2 - 3[ 1 0 3 1
[3 - 4] 0 0 1 2
[4 - 5[ 3 1 2 3
[5 - 6[ 1 1 1 1
En cada casilla se registra el no de veces que se repite conjuntamente el
par (x, y).
Si una de las casillas se repite en muy pocas ocaciones es preferible
agrupar la variable en intervalos.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales
Estructura
Distribuciones Condicionales
Covarianza y Correlación

EJEMPLO

Se quiere observar la relación que existe entre el número de horas diarias que
utiliza un vendedor en linkedin (X) y el ingreso obtenido semanalmente, en
millones de pesos (Y )

Variable N o de Horas X
XX
XXX Horas
Ingreso XXX 2 3 4 5
X
[1 - 2[ 2 1 1 0
V. Ingreso Y

[2 - 3[ 1 0 3 1
[3 - 4] 0 0 1 2
[4 - 5[ 3 1 2 3
[5 - 6[ 1 1 1 1
En cada casilla se registra el no de veces que se repite conjuntamente el
par (x, y).
Si una de las casillas se repite en muy pocas ocaciones es preferible
agrupar la variable en intervalos.
Estudia el comportamiento simultáneo entre dos variables aplicadas a
una cierta unidad de observación.
Marı́a José Alejandra Medina Fritz Estadı́stica (523117).
Tablas de Doble Entrada
Distribuciones Marginales
Estructura
Distribuciones Condicionales
Covarianza y Correlación

EJEMPLO

Se quiere observar la relación que existe entre el número de horas diarias que
utiliza un vendedor en linkedin (X) y el ingreso obtenido semanalmente, en
millones de pesos (Y )

Variable N o de Horas X
XX
XXX Horas
Ingreso XXX 2 3 4 5
X
[1 - 2[ 2 1 1 0
V. Ingreso Y

[2 - 3[ 1 0 3 1
[3 - 4] 0 0 1 2
[4 - 5[ 3 1 2 3
[5 - 6[ 1 1 1 1
En cada casilla se registra el no de veces que se repite conjuntamente el
par (x, y).
Si una de las casillas se repite en muy pocas ocaciones es preferible
agrupar la variable en intervalos.
Estudia el comportamiento simultáneo entre dos variables aplicadas a
una cierta unidad de observación.
Marı́a José Alejandra Medina Fritz Estadı́stica (523117).
Tablas de Doble Entrada
Distribuciones Marginales
Distribuciones Condicionales
Covarianza y Correlación

DISTRIBUCIONES MARGINALES

Se definen como las distribuciones por separado de cada una de las compo-
nentes de la variable bidimensional, anulando el efecto de la otra

Marginal de Y
Marginal de X
Ingresos en $ ni
N o de horas ni
]1 - 2] 4
2 7
]2 - 3] 5
3 3
]3 - 4] 3
4 8
]4 - 5[ 9
5 7
]5 - 6[ 4
Total 25
Total 25

Las distribuciones marginales son útiles cuando las variables son indepen-
dientes, es decir no hay relación entre ellas.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales
Distribuciones Condicionales
Covarianza y Correlación

La construcción de una tabla de doble entrada, por lo general, no se obtiene


directamente de un programa estadı́stico.

1 Decidir si es necesario agrupar la variable.

2 Calcular la cantidad de intervalos apropiados.

3 En el caso de v.a cuantitativas discretas, es posible categorizar.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales
Distribuciones Condicionales
Covarianza y Correlación

DISTRIBUCIONES CONDICIONALES

En ocaciones podemos necesitar condicionar los valores de la variable Y a un


determinado valor de X o viceversa. Este tipo de distribuciones se denomina
Distribución de la variable “Y ” condicionada a “X”
EJEMPLO 2
Qué pasarı́a si se quiere saber cuál es el promedio de horas diarias, si el
ingreso varı́a entre 1 y 4 millones de pesos.

Variable N o de Horas Diarias Horas diarias ni


XX
XXX Horas 2 3
Ingreso XXX 2 3 4 5 3 1
X
Ingreso

]1 - 2] 2 1 1 0 4 5
]2 - 3] 1 0 3 1 5 3
]3 - 4] 0 0 1 2 Total 12

X/ [1,4]

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

COVARIANZA Y CORRELACIÓN

Uno de los objetivos del estudio de Variables Aleatorias Bidimensionales, es


detereminar si existe o no relación entre las variables X e Y .

Las medidas estadı́sticas que periten cuantificar esta relación son:

Covarianza

Correlación

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

COVARIANZA COV(X,Y) ∨ SXY

Mide la variación conjunta entre 2 variables cuantitativas X e Y , con respecto


a la media aritmética de cada una de ellas

Pr Ps
i=1 j=1 (xi − x̄)(yi − ȳ)
cov(X, Y ) =
n

S(X, Y ) = XY − X × Y
= E(XY ) − E(X)E(Y )

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

PROPIEDADES DE LA COVARIANZA

Si cov(X, Y ) > 0 ⇒ ∃ dependencia lineal directa entre X e Y , es decir,


un aumento o disminución en una de las variables, provoca el mismo
efecto en la otra variable.

Si cov(X, Y ) < 0 ⇒ ∃ dependencia lineal inversa entre X e Y , esto quiere


decir que un aumento o disminución en una de las variables, provoca el
efecto inverso en la otra variable.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

PROPIEDADES DE LA COVARIANZA

Si cov(X, Y ) > 0 ⇒ ∃ dependencia lineal directa entre X e Y , es decir,


un aumento o disminución en una de las variables, provoca el mismo
efecto en la otra variable.

Si cov(X, Y ) < 0 ⇒ ∃ dependencia lineal inversa entre X e Y , esto quiere


decir que un aumento o disminución en una de las variables, provoca el
efecto inverso en la otra variable.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

COVARIANZA COV (X, Y )

EJERCICIO 3

Del EJERCICIO 1, se tiene:

Datos
(15×0×2)+...+(55×1×3)
X = 3,6; Y = 36,6; XY = 25
= 169,6

Luego,

cov(X, Y ) = 169,6 − 3,6 × 36,6


= 37,84

∴ la variación conjunta entre X e Y es 37,84

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

CORRELACIÓN (ρX,Y )

Este coeficiente mide el grado o magnitud de la asociación lineal entre 2


variables de tipo cuantitativas.

cov(X, Y )
ρ(X, Y ) = ,
SX × SY

donde

SX y SY son desviaciones estándar poblacionales de X e Y , respectiva-


mente.

Diremos que 2 variables son icorrelacionadas o no presentan relación, si


y sólo si, la covarianza es cero.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

INTERPRETACIÓN DEL COEFICIENTE DE CORRELACIÓN

ρ < 0 ⇒ ∃ relación lineal inversa.

ρ = 0 ⇒ @ relación lineal.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

INTERPRETACIÓN DEL COEFICIENTE DE CORRELACIÓN

ρ < 0 ⇒ ∃ relación lineal inversa.

ρ = 0 ⇒ @ relación lineal.

ρ > 0 ⇒ ∃ relación lineal directa entre ambas variables.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

INTERPRETACIÓN DEL COEFICIENTE DE CORRELACIÓN

ρ < 0 ⇒ ∃ relación lineal inversa.

ρ = 0 ⇒ @ relación lineal.

ρ > 0 ⇒ ∃ relación lineal directa entre ambas variables.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

PROPIEDADES

1 |ρXY | ≤ 1 ⇒ −1 ≤ ρXY ≤ 1.

2 Sı́ las variables son icorrelacionadas entre sı́, ρXY = 0.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

PROPIEDADES

1 |ρXY | ≤ 1 ⇒ −1 ≤ ρXY ≤ 1.

2 Sı́ las variables son icorrelacionadas entre sı́, ρXY = 0.

3 Relación lineal perfecta entre dos variables implica que ρXY = 1∨ρXY =
−1.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

PROPIEDADES

1 |ρXY | ≤ 1 ⇒ −1 ≤ ρXY ≤ 1.

2 Sı́ las variables son icorrelacionadas entre sı́, ρXY = 0.

3 Relación lineal perfecta entre dos variables implica que ρXY = 1∨ρXY =
−1.

4 Miéntras más cercano esté ρ de ± 1, mejor será el grado de asociación o


relación.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

PROPIEDADES

1 |ρXY | ≤ 1 ⇒ −1 ≤ ρXY ≤ 1.

2 Sı́ las variables son icorrelacionadas entre sı́, ρXY = 0.

3 Relación lineal perfecta entre dos variables implica que ρXY = 1∨ρXY =
−1.

4 Miéntras más cercano esté ρ de ± 1, mejor será el grado de asociación o


relación.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).


Tablas de Doble Entrada
Distribuciones Marginales Covarianza
Distribuciones Condicionales Coeficiente de Correlación lineal
Covarianza y Correlación

PROPIEDADES

1 |ρXY | ≤ 1 ⇒ −1 ≤ ρXY ≤ 1.

2 Sı́ las variables son icorrelacionadas entre sı́, ρXY = 0.

3 Relación lineal perfecta entre dos variables implica que ρXY = 1∨ρXY =
−1.

4 Miéntras más cercano esté ρ de ± 1, mejor será el grado de asociación o


relación.

Marı́a José Alejandra Medina Fritz Estadı́stica (523117).

También podría gustarte