Está en la página 1de 22

ADE

ADE + DERECHO
Presentación y diapositivas
ESTADÍSTICA I
Curso 2022-23 (29.09.22)

Profesor
Dr. Juan Manuel Menéndez Blanco
juanmanuel.menendez@urjc.es

https://gestion2.urjc.es/pdi/ver/juanmanuel.menendez
https://www.linkedin.com/in/juan-manuel-men%C3%A9ndez-blanco-
9448a919/?originalSubdomain=es
Tema 2
Análisis estadístico
bidimensional

Estadística I
ADE + DERECHO
ADE
¿Qué se estudia en el análisis
bidimensional?
1. Se estudian 2 características de un mismo elemento, individuo
o fenómeno de la población (peso y altura, costes y precios,
ingresos y beneficios de la empresa, salario percibido y antigüedad
en la empresa etc.).

2. Tratamos de determinar si existe algún tipo de relación


(correlación) y de qué intensidad entre la X y la Y:
 Dependencia funcional.

 Independencia funcional.

Dependencia estadística (en algún grado intermedio).


* Casos posibles para variables numéricas: X continua e Y
continua; X discreta e Y continua; X continua e Y discreta; X e Y
discretas.
* Si las variables bidimensionales son de atributos: TABLA DE
CONTINGENCIA.
Tablas de correlación o de frecuencias
Distribuciones marginales: concepto y
significado

Aunque estemos trabajando con una distribución bidimensional,


podemos centrarnos en estudiar el comportamiento de una de
las variables con independencia de como se comporta la otra a
través de la denominada distribución marginal.

Distribución marginal de X Distribución marginal de Y


Xi ni. Yj n.j
X1 n1. Y1 n.1
X2 n2. Y2 n.2
… … … …
…. … … …
Xh nh. Yk n.k
Distribuciones marginales: concepto y
significado
En relación con el concepto de frecuencia marginal
( ni. o n.j ):

1. No importa el valor que toma la otra variable.

2. Coincide con el valor de la frecuencia de la


variable unidimensional.

3. Ponemos un punto o asterisco donde la otra


variable no nos importa que tome cualquier valor.

4. En la tabla de correlación, las distribuciones de


frecuencias marginales se corresponden con la
última fila y columna.
Distribuciones marginales y frecuencias
marginales
k
ni• = ni1 + ni 2 + ni 3 + ... + nij + ... + nik = ∑n
j =1
ij
h
n• j = n1 j + n2 j + n3 j + ... + nij + ... + nhj = ∑n
i =1
ij

Definimos:
k h son las frecuencias absolutas
ni• = ∑ nij n• j = ∑ nij marginales de las variables X e
j =1
i =1 Y, respectivamente.

h k h k


= n
=i 1

= n ∑∑
i•= n
=j 1
•j
=i 1 =j 1
ij N
Distribuciones marginales y frecuencias
marginales

k nij h nij son las frecuencias relativas


f i• = ∑ f• j = ∑ marginales de las variables X e
j =1 n i =1 n
Y, respectivamente.
Independencia estadística

nij
N Averias 0 1
Graves Y
2 3 Marginal de leves
0 0,2308 0,0385 0,0077 0,0000 0,2769

Leves X
1
2
0,1692
0,0769
0,0615
0,0385
0,0231
0,0154
0,0077
0,0154
0,2615
0,1462 ni.
3 0,0923 0,0615 0,0077 0,0154 0,1769
4
5
0,0615
0,0308
0,0308
0,0077
0,0000
0,0000
0,0077
0,0000
0,1000
0,0385 N
Marginal de Graves
0,6615 0,2385 0,0538 0,0462 1

n. j
N

ni . n. j nij
Si = ∀ij ⇒ Independencia
N N N
Varianzas y covarianza

∑ ( xi − x ) 2
ni• Varianza de X
Var ( X ) i=
=1
S X2
N
k

∑ ( y j − y ) 2
n• j
Varianza de Y Var (Y )
= j =1
= SY2
N

h k

∑∑ ( x − x )( y
=i 1 =j 1
− y )nij
i j
Covarianza entre X e Y
Cov( X , Y ) = S XY
N Mide si existe asociación lineal
entre X e Y, positiva o negativa
pero no la intensidad
Coeficiente de correlación lineal

El valor de la covarianza depende de los valores de las variables y,


por tanto, de sus unidades. Para poder eliminar las unidades y
tener una medida adimensional utilizamos el COEFICIENTE DE
CORRELACIÓN LINEAL (rxy )
S xy
rxy =
SxS y
• Es un coeficiente adimensional
Propiedades: • -1 ≤ r ≤ 1
• Si hay relación lineal positiva: r > 0 y próximo a 1
• Si hay relación lineal negativa: r < 0 y próximo a -1
• Si no hay relación lineal: r se aproxima a 0
• Si X e Y son independientes: Sxy = 0 y, por tanto, r = 0
Correlación lineal e independencia
estadística

 Si dos variables son independientes, su


covarianza es cero pero……..

………….si la covarianza es cero no


podemos deducir que son independientes
aunque sí podemos afirmar que linealmente no
tienen relación.
Gráficos de dispersión de datos con
diversos coeficientes de correlación lineal

Y Y Y

X X X
r= r= r=
Y
Y Y

X X X
r= r= r=
Tópico especial para estudiar y
discutir
Regresión lineal

 El objetivo principal de la regresión es


descubrir el modo en que se relacionan.

Dos variables pueden considerarse:

 Variables independientes  No tienen relación


(una de ellas no sirve para explicar los
movimientos de la otra)
 Dependencia funcional  Y=f(x)
 Dependencia estadística
Gráficos de dispersión: ¿ Hay asociación?
Dadas dos variables X y Y tomadas sobre el mismo elemento de la
población, el diagrama de dispersión es simplemente un gráfico de
dos dimensiones, donde en un eje (la abscisa) se sitúa una
variable, y en el otro eje (la ordenada) se sitúa la otra variable. Si
las variables están correlacionadas, el gráfico mostraría algún nivel
de correlación (tendencia) entre las dos variables. Si no hay
ninguna correlación, el gráfico presentaría una figura sin forma,
una nube de puntos dispersos en el gráfico.

Asociación
positiva. Si
aumenta X
aumenta Y

Estadística Económica 2007-2008. Sara Mateo.


Gráficos de dispersión / recta de regresión
Para el cálculo de la recta de regresión se aplica el método de
mínimos cuadrados entre dos variables. Esta línea es la que
hace mínima la suma de los cuadrados de los residuos, es
decir, es aquella recta en la que las diferencias elevadas al
cuadrado entre los valores calculados por la ecuación de la
recta y los valores reales de la serie, son las menores posibles.

y = a + bx
Interpretando el r y el R 2

rxy = R
2
Elevado al cuadrado obtenemos el coeficiente de
determinación que sirve como medida del buen
R
ajuste de la recta de regresión

2
R Tanto por uno de la Y que viene explicado por la X

SIRVE PARA DETERMINAR SI EL AJUSTE HECHO ES BUENO. ES DECIR,


SI LA VARIABLE X EXPLICA LAS VARIACIONES DE LA VARIABLE Y.
DEBERÁ SER > 0.75
El coeficiente de correlación entre dos
variables con Excel

 Seleccionar Datos /Análisis de Datos

 Elegir Correlación
 Darle a OK . . .
El coeficiente de correlación entre dos
variables con Excel
(continuación)

 Introducir el rango de datos de


entrada y seleccionar las
opciones correctas.
 Darle a OK
Interpretando el resultado con un
ejemplo
Scatter Plot of Test Scores

 r = .733 100

95

Test #2 Score
90

 Hay una relación líneal 85

positiva y significativa 80

entre las puntuaciones


75

70

del test 1 y 2 70 75 80 85

Test #1 Score
90 95 100

 Los estudiantes con mayor puntuación en el


primer test tendieron a puntuar alto en el
segundo
Rasgos del coeficiente de correlación, r
Repaso final
 El coef r es una medida de relación ente las variables
 Es una medida de tanto la dirección como de la
intensidad /significatividad de una relación lineal entre
dos variables (no tiene unidades)
 Rangos entre –1 y 1
 En cuanto más cerca a –1, más significativa es la
relación lineal negativa
 En cuanto más cerca a 1, más significativa es la relación
lineal positiva
 En cuanto más cerca a 0, menos significativa es
cualquier relación lineal (positiva o negativa)

También podría gustarte