Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BIDIMENSIONAL
LOGRO
APRENDIZAJE:
DE
ESTADSTICA
BIDIMENSIONAL
Analiza el comportamiento conjunto de dos variables en una
unidad de estudio, es decir busca la asociacin o relacin
que existe entre ambas variables, se representa como un
conjunto de pares de datos (X,Y), donde:
X : es la variable independiente (llamado factor)
Y : es la variable dependiente (llamado resultado)
Ejemplos:
Estrs laboral y desempeo de los trabajadores
Gasto en publicidad y volumen de ventas
Nivel de estudios y regin de procedencia
Ingresos y nivel socioeconmico
Cociente intelectual y rendimiento acadmico
PRESENTACIN DE DATOS
BIVARIADOS
Tablas de
contingencia
Variable
aleatoria 2
Variable aleatoria 1
Grupo Grupo Total
1
2
Factor 1 (a)
2 (b)
1
Factor 3 (c)
4 (d)
2
Total
Total
(n)
Grfico
de
agrupadas
barras
100%
90%
Depresi
n
80%
70%
60%
50%
40%
30%
20%
36%
30%
18%
16%
10%
0%
Masculino
Femenino
ORGANIZACIN Y PRESENTACIN DE
DATOS
La asociacin o relacin de dos variables se debe resumir los
resultados en:
Tablas de frecuencias bidimensionales o contingencia
Grfico de barras agrupadas
Var Y
Var X
y1
y2
...
yj
...
yl
fi. ni.
x1
f11
f12
f1j
f1l
f1.
x2
f21
f22
f2j
f2l
f2.
fi1
fi2
fk1
fk2
xi
xk
fij
fkj
j1
f.1
f.2
f.j
fil
fi.
fkl
fk.
f.j n. j
i1
f.l
n..
fij n
i1 j1
Donde:
Las frecuencias absolutas conjuntas se
designa con el ndice ij es decir: fij
La suma de los totales se considera de tres
formas:
f i . es la suma total de las
a) Totales por fila;
frecuencias absolutas en fila:
f. j es la suma total de las
b) Totales por columna;
frecuencias absolutas en columna:
ij
f i.
f ij
f. j
hij
dado
f ij
n
Distribuciones
marginales
a) Distribucin marginal de X; est dado por las
marcas de clase (Xi) y por los totales de las frecuencia
por filas (fi.) :
X
fi.
x1
f1.
x2
f2.
:
xk
:
fk.
Total
ni.
y2
:
yl
Total
f.j
:
f.l
n.j
TABLAS DE
CONTINGENCIA
Variable
secundaria
Variable de
estudio
Grupo 1
Grupo 2
Factor 1
1 (a)
2 (b)
Factor 2
3 (c)
4 (d)
Marginal
(a+c)
Marginal
(b+d)
Total
Total
Marginal
(a+b)
Marginal
(b+c)
Total (n)
Variable de estudio
Es la variable que identifica la lnea de
investigacin
Variable aleatoria
Es la variable cuya distribucin se va a conocer con la
recogida de los datos
Variable fija
Es la variable cuya distribucin se conoce antes de realizar
el estudio comparar el rendimiento acadmico
Ejemplo.
de 30 estudiantes de la seccin A y 35
estudiantes de la seccin B
TABLAS DE
CONTINGENCIA (Objetivo
asociar)
Variable
Variable
aleatoria
Grupo 1
aleatoria
Grupo 2
Factor 1
Factor 2
100%
EJEMPLO 1:
La municipalidad del distrito de
Ventanilla est interesada en averiguar si
el nivel de estudios de sus pobladores
est asociado a la regin de procedencia,
para ello ha seleccionado un grupo de
personas que se encuentran registradas
en la RENIEC correspondientes a su
distrito.
Los resultados se presentan en la
siguiente
tabla
de
frecuencias
bidimensional.
Presentacin de resultados
Tabla1. Nivel de estudios de pobladores de Ventanilla por
regin de procedencia
Nivel de estudios
Total
Regin de
procedenc
ia
Primaria
n
Costa
40
10.7
80
21.3
60
16.0
180
48.0
Sierra
35
9.3
35
9.3
30
8.0
100
26.7
Selva
30
8.0
40
10.7
25
6.7
95
25.3
105
28.0
155
41.3
115
30.7
375
100.0
Total
Secundaria
Superior
21.3
20
16.0
15
10.7
Frecuencia (%)
9.3 9.3
10
10.7
8.0
8.0
6.7
Costa
Primaria
Secundaria
Sierra
Selva
Superior
TABLAS DE CONTINGENCIA
(Objetivo comparar)
Variable fija
Grupo 1
Grupo 2
Variable
aleatoria
Factor 1
Factor 2
100%
100%
100%
TABLAS DE CONTINGENCIA
(Objetivo comparar)
Variable aleatoria
Variable
fjia
Grupo 1
Grupo 2
Factor 1
100%
Factor 2
100%
100%
EJEMPLO 2.
En la encuesta nacional de hogares realizada por el INEI
en el 2012, se ha registrado la zona de residencia y el
nivel de pobreza de los hogares del departamento de
Lima.
1) Hallar los porcentajes por fila de las familias
del departamento de Lima
2) Interpretar : f11, h23%, f1. , f.2
Tabla 2. Nivel de pobreza segn regin de
procedencia
Nivel de pobreza
Pobre no
rea de
No pobre
extremo
residencia
n
Urbana
Rural
Total
Pobre
extremo
n
Total
n
2336
270
10
2616
100
203
20
232
100
2539
290
19
2848
100
x
a) Media o promedio de la variable
Xn
:
i 1
f i.
y
j 1
f. j
y
b) Media o promedio de la variable
Yn:
k
fi. x i x 2
i1
n
l
f. j y i
d) Varianza de la variable Y
:
j1
S2
y
Cov x, y i 1 j 1
n
MEDIDAS DE ASOCIACIN
a) Covarianza: mide la variabilidad conjunta de X e
k
l
Y
f ij xi x y j y
Cov x, y i 1 j 1
n
b) Coeficiente de correlacin de Pearson : mide
el grado de asociacin lineal entre las variables X
e Y, se simboliza con R
R
cov( X, Y )
Sx Sy
Grado de relacin de
variables
Donde : 1 R 1
Interpretacin
del
coeficiente
correlacin de Pearson:
?
Punto de
corte
de
EJEMPLO 3
Se ha recolectado la estatura (X) en cm y su
peso (Y) en kg de un grupo de estudiantes cuyos
resultados se muestran en la tabla de distribucin
de frecuencias bidimensionales.
Estatura en
cm
[50, 60>
Peso en kg
[60, 70>
[70, 80>
[160, 165>
12
18
3
[165, 170>
15
25
8
[170, 175>
4
10
5
[175, 180>
1
3
10
a) Hallar las distribuciones marginales
b) Interprete f22 , f33 , f41, f1. , f.2 , h12%, h2.%,
c) Encuentre e interprete el peso y la talla
promedio
d) Encuentre la covarianza entre peso y estatura
e) Hallar e interpretar el coeficiente de correlacin
de Pearson