Está en la página 1de 9

UNIVERSIDAD CENTRAL DE VENEZUELA

FACULTAD DE CIENCIAS ECONMICAS Y SOCIALES


ESCUELA DE ESTADSTICA Y CIENCIAS ACTUARIALES
DEPARTAMENTO DE ESTADSTICA Y PROBABILIDAD
CTEDRA DE MTODOS ESTADSTICOS
ASIGNATURA: ESTADSTICA I
PROFESORAS: SANDRA V. PINTO R. Y MARA TERESA SALOMN V.

TEMA 1

ANLISIS DESCRIPTIVO BIVARIANTE

El anlisis descriptivo bivariante se refiere al estudio de la distribucin conjunta de


los datos obtenidos al medir dos variables sobre un conjunto de unidades de
observacin. Las observaciones de cada variable constituye una dimensin, por lo
que tambin se le conoce como anlisis descriptivo bidimensional. Los datos estn
conformados por pares de observaciones que corresponden a la medicin obtenida
de cada variable en cada unidad de observacin. El anlisis se puede realizar sobre
combinaciones de variables de diferente tipo: cualitativa-cualitativa, cuantitativa-
cuantitativa, cualitativa-cuantitativa. La obtencin de medidas descriptivas,
depende de la naturaleza de las variables en estudio. La organizacin de los datos
se realiza sobre Tablas de Frecuencias Bidimensionales.

1. DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES


Sean X y Y variables cualesquiera medidas sobre n unidades de observacin.
A cada unidad de observacin corresponder, por tanto, un par valores
correspondientes a las mediciones obtenidas de cada variable, esto es: (Xi, Yi);
i=1,2,....,n. Tales observaciones pueden ser organizadas en una Tabla
Bidimensional o de Doble Entrada, en la cual se representa la Distribucin de
Frecuencias conjunta de las clases de ambas variables.

SP/MTS 1
En las Tablas Bidimensionales las frecuencias internas se denominan
Frecuencias Condicionales, ya que estas corresponden a la frecuencia de una
clase de X condicionada a una clase de Y a la frecuencia de una clase de Y
condicionada a una clase X, segn se elija entre X Y para el anlisis de los
datos contenidos en la tabla. En los mrgenes de las tablas, se registra la
Distribucin de Frecuencias unidimensionales de X y Y, las cuales se
denominan Frecuencias Marginales.

Las Tablas Bidimensionales pueden ser de frecuencias absolutas, frecuencias


relativas o frecuencias relativas porcentuales. Tambin suele crearse Tablas
Bidimensionales que muestren simultneamente frecuencias absolutas y
porcentuales.

1.1. TABLAS DE FRECUENCIAS ABSOLUTAS BIDIMENSIONALES


En estas tablas se representa la Distribucin de Frecuencias Absolutas
Condicionales y Marginales de las variables X y Y.

Y
X
y1 y2 ... yk f i.
Frecuencia
x1 f11 f12 ... f1k f1.
Absoluta
x2 f21 f22 ... f2k f2. Marginal
... ... ... ... ... ...
xm fm1 fm2 ... fmk fm.
f.j f.1 f.2 ... f.k f.. = n

Frecuencia Absoluta
Condicional
donde:
xi : clases de la variable X; i=1,2,...,m
yj : clases de la variable Y; j=1,2,...,k
f(xi /yj) frecuencias absolutas condicionales de xi dado yj
fij =
f(yj /xi) frecuencias absolutas condicionales de yj dado xi

SP/MTS 2
fi. : frecuencias absolutas marginales de X
f.j : frecuencias absolutas marginales de Y

Adems, se cumplen las siguientes relaciones:

k
fij fi
j 1
m
fij fj
i 1
m
fi n
i 1
k
fj n
j 1
m k
fij f n
i 1 j 1

1.2. TABLAS DE FRECUENCIAS RELATIVAS BIDIMENSIONALES


En estas tablas se representa la Distribucin de Frecuencias Relativas
Condicionales y Marginales de las variables X y Y.

Y
X
y1 y2 ... yk hi.
x1 h11 h12 ... h1k h1 .
x2 h21 h22 ... h2k h2 . Frecuencia
Relativa
... ... ... ... ... ... Marginal
xm hm1 hm2 ... hmk hm.
h.j h.1 h.2 ... h.k 1

Frecuencia Relativa
Conjunta respecto al
total

donde:
xi : clases de la variable X; i=1,2,...,m
yj : clases de la variable Y; j=1,2,...,k
f ij
h ij frecuencias relativas respecto al total
n

SP/MTS 3
fi
hi frecuencias relativas marginales de X
n
f j
h j frecuencias relativas marginales de Y
n

adems, se cumplen las siguientes relaciones:

k
h ij hi
j 1
m
h ij h j
i 1
m
hi 1
i 1
k
h j 1
j 1
m k
h ij 1
i 1 j 1

1.3. DISTRIBUCIONES CONDICIONALES


Las Frecuencias Relativas Condicionales tambin pueden calcularse con
respecto a la Frecuencias Absolutas Marginales de X (filas) de Y (columnas).
En tales casos, las frecuencias relativas condicionales se obtienen de la
siguiente manera:

f ij
h j xi frecuencia relativa condicional de Y respecto a X
fi (frecuencia relativa condicional por fila)
f ij
hi y j frecuencia relativa condicional de X respecto a Y
f j (frecuencias relativa condicional por columna)

adems, en cada caso se cumplen las siguientes relaciones:

SP/MTS 4
Frecuencias Relativas Condicional por fila Frecuencias Relativas Condicional por columna

h /x 1 h /y 1
m k

i 1 j i j 1 i j

1.4. TABLAS DE FRECUENCIAS PORCENTUALES BIDIMENSIONALES


En estas tablas se representa la Distribucin de Frecuencias Porcentuales
Condicionales y Marginales de las variables X y Y.

Y
X
y1 y2 ... yk hi. %
x1 h11% h12% ... h1k% h1 . % Frecuencia
Relativa
x2 h21% h22% ... h2k% h2 . % Porcentual
... ... ... ... ... ... Marginal

xm hm1% hm2% ... hmk% hm. %


h.j % h.1 % h.2 % ... h.k % 1

Frecuencia Porcentual
Condicional respecto
donde: al total

xi : clases de la variable X; i=1,2,...,m


yj : clases de la variable Y; j=1,2,...,k
f ij
h ij % * 100 frecuencias relativas porcentuales condicionales respecto al
n
total
fi
hi % * 100 frecuencias relativas porcentuales marginales de X
n

f j
h j% * 100 frecuencias relativas porcentuales marginales de Y
n

adems, se cumplen las siguientes relaciones:

SP/MTS 5
m k
h ij % 100%
i 1 j 1
m
h i % 100%
i 1
k
h j% 100%
j 1

Las Frecuencias Relativas Porcentuales Condicionales tambin pueden


calcularse con respecto a las Frecuencias Marginales de X (filas) de Y
(columnas). En tales casos, las frecuencias relativas porcentuales se obtienen de
la siguiente manera:

f ij frecuencias porcentuales condicionales de Y respecto


h ij % x i * 100 a X (frecuencias relativas porcentuales por fila)
fi

f ij
h ij % y j * 100 frecuencias porcentuales condicionales de X respecto
f j a Y (frecuencias relativas porcentuales por columna)

adems, en cada caso se cumplen las siguientes relaciones:

Frecuencias porcentuales por fila Frecuencias porcentuales por columna


m k
h ij % / x i 100% h ij % / y j 100%
i 1 j 1

2. ANLISIS DESCRIPTIVO BIVARIANTE PARA VARIABLES CUALITATIVAS


El anlisis descriptivo bidimensional de variables cualitativas se refiere a la
obtencin de la Distribucin de Frecuencias Bidimensionales y a su
interpretacin. Esto supone la produccin de las tablas de frecuencias
absolutas, relativas y porcentuales.

3. ANLISIS DESCRIPTIVO BIVARIANTE PARA VARIABLES CUANTITATIVAS


El anlisis descriptivo bidimensional de variables cuantitativas requiere la
obtencin de la Distribucin de Frecuencias Bidimensionales, de las Medidas
Descriptivas y la interpretacin de cada uno de estos resultados. Esto supone

SP/MTS 6
la produccin de las tablas de frecuencias absolutas, relativas y porcentuales,
as como el clculo de medidas de tendencia central y de dispersin.

A continuacin se exponen, algunas de las medidas estadsticas empleadas en


la descripcin bidimensional de variables cuantitativas.

3.1. MEDIAS Y VARIANZAS DE LAS DISTRIBUCIONES MARGINALES Y


CONDICIONALES

Sean X y Y variables cuantitativas medidas sobre un conjunto de n unidades de

observacin. Sean x1,x2,...,xm y y1, y2,...yk las clases obtenidas al agrupar en

forma puntual las observaciones de X y Y respectivamente. Se puede obtener


las medias y varianzas de las distribuciones marginales (unidimensionales) y
condicionales (bidimensionales) para enriquecer el anlisis descriptivo de los
datos.

3.1.1 Medias y Varianzas Marginales


Las medias y varianzas marginales se obtienen a partir de la distribucin
unidimensional de las variables; es decir, los clculos se realizan
empleando las frecuencias marginales.

Medias Marginales Varianzas Marginales


m
2
m xi x * fi m 2
xi * fi 2 i 1 xi x * fi
i 1
m
xi * fi S x m
X i 1 n
m
i 1 n fi
fi i 1
i 1
k k
2
y j *f j yj y *f j 2
j 1
k y j *f j 2 j 1
k yj y *f j
Y k
S y k
j 1 n j 1 n
f j f j
j 1 j 1

3.1.2 Medias y Varianzas Condicionales


Las medias y varianzas condicionales se obtienen a partir de la
distribucin bidimensional por lo que en los clculos se emplean las
frecuencias condicionales.

SP/MTS 7
Medias Condicionales Varianzas Condicionales
m m 2
x *f
i ij m x X y *f m 2
X y j
i 1
x *h y
i i j
S y 2
x j
i 1 i j ij
x i
X y j
*h y
i j
f j
i 1
f j
i 1

k k 2

j 1
y *f
j ij k y j
Y x i
*f ij k 2
Y x i
y * h x
j j i
S x 2
y i
j 1
y j
Y x i
*h x j i
f i
j 1
f i
j 1

3.2. COVARIANZA: SXY


La covarianza es una medida de la dispersin conjunta de dos variables.
Permite conocer si entre dos variables existe o no relacional lineal. La
covarianza, Sxy, indica el sentido de la relacin; esto es, si la relacin lineal
entre las variables es directa o inversa. El clculo de la covarianza, se realiza de
la siguiente manera:

Para datos no agrupados Para datos agrupados en forma puntual


n m k

xi x yi y i 1 j 1
x i
x y j
y *f ij

i 1
S xy m k
S xy f ij
n i 1 j 1

Si la covarianza es positiva la relacin lineal entre las variables es directa, es


decir ambas variables crecen o decrecen simultneamente. Si es negativa, la
relacin lineal entre las variables es inversa, es decir cuando una variable crece,
la otra decrece. Si es cero, indica que no existe relacin lineal entre las
variables.

3.3. COEFICIENTE DE CORRELACIN PRODUCTO-MOMENTO DE PEARSON

El coeficiente de correlacin de Pearson, rxy, es una medida del sentido y la


intensidad de la relacin lineal entre dos variables. Se obtiene mediante la
siguiente relacin:

S xy
rxy , - 1 rxy 1
S xS y

SP/MTS 8
Es decir, el coeficiente de correlacin lineal de Pearson se obtiene a travs del
cociente entre la covarianza(Sxy) y el producto de las desviaciones tpicas de
X(Sx) y Y(Sy) respectivamente.

El coeficiente de correlacin de Pearson se interpreta de la siguiente manera:

-1 , existe perfecta relacin lineal inversa entre X y Y


rsy = 0, no existe relacin lineal entre X y Y
+1, existe perfecta relacin lineal directa entre X y Y

Cuanto ms prximo a los extremos se encuentre rsy ms fuerte es la relacin


lineal entre las variables. Cuanto ms prximo a cero, ms dbil es la relacin.

SP/MTS 9

También podría gustarte