Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE INGENIERÍA
ESTADISTICA
ESTADÍSTICA BIDIMENSIONAL
Semana 4
B) AMBAS CUALITATIVAS
Son aquellas cuyos B1. X nominal e Y nominal
elementos de variación
tienen componente B2. X ordinal e Y ordinal
cualitativo o no
B3. X nominal e Y ordinal
numérico.
C) UNA CUANTITATIVA Y OTRA CUALITATIVA
C1. X discreta e Y nominal y viceversa ( Nº de hijos, sexo)
C2. X discreta e Y ordinal y viceversa ( Nº de hijos, grado de instrucción.)
C3. X continua e Y nominal y viceversa ( Edad, sexo)
C4. X continua e Y ordinal y viceversa ( Edad, grado de instrucción)
ESTADÍSTICA BIDIMENSIONAL
Analiza el comportamiento conjunto de dos variables en una unidad de
estudio, busca la posible ASOCIACIÓN O RELACIÓN (DEPENDENCIA O
INDEPENDENCIA) que existe entre las variables involucradas (es decir, si se
influyen mutuamente); se representa como un conjunto de pares de datos
(X,Y), donde:
X : es la variable independiente (llamada factor).
Y : es la variable dependiente (llamada resultado).
Ejemplos:
• La influencia que tienen los ingresos de una determinada familia en los gastos que tienen.
• Cómo influye la velocidad de un cierto automóvil en su consumo de Combustible.
• La relación que existe entre los pesos y las estaturas de un grupo de personas.
• Podemos estar interesados en estudiar la relación entre el sexo y el lugar de procedencia de estudiantes.
• La relación entre el sexo y el rendimiento académico en el curso de estadística.
5
• La relación la edad y el tiempo de servicio de los participantes en un programa de capacitación, etc.
TABLAS BIDIMENSIONALES
Si (X,Y) es una variable bidimensional que toma los valores (xi, yj) con i = 1,2,3,… ,f
y j = 1,2,3…,c sobre una muestra de tamaño n de cierta población.
Llamamos así a una tabla de doble entrada donde se representa en la primera
columna los diferentes valores observados para una variable que denominaremos por
X (xi) ordenados de menor a mayor y en la primera fila los diferentes valores
observados para la otra variable Y (yj), y en el centro sus correspondientes
frecuencias conjuntas.
Las tablas de frecuencia que representan simultáneamente dos variables
HABITUALMENTE CATEGÓRICAS son llamadas comúnmente TABLAS DE
CONTINGENCIAS.
TABLA BIDIMENSIONAL O DE CONTINGENCIA
Así, una tabla de contingencia es una tabla de doble entrada, donde en
cada casilla figurará el número de casos o individuos que poseen un nivel
de una de las características analizadas y en el otro nivel de la otra
característica.
DE X
DE Y
TABLA BIDIMENSIONAL O DE CONTINGENCIA
La distribución de frecuencia bidimensional de (X,Y) se puede expresar en una tabla bidimensional
(FRECUENCIAS ABSOLUTAS). FRECUENCIAS
MARGINALES DE “X”
FRECUENCIAS
ABSOLUTAS
FRECUENCIAS
MARGINALES
DE “Y”
TABLA BIDIMENSIONAL (O CONTINGENCIA):
EJEMPLO – FRECUENCIAS ABSOLUTAS
Ejemplo.- Se representa por X el número de hijos de 100 familias y
por Y en número de hijas
N° HIJAS (Y)
0 1 2 3 TOTAL
N° HIJOS (X)
0 10 15 15 3 43
1 10 12 7 2 31
2 8 4 3 1 16
3 3 2 1 0 6
4 2 1 1 0 4
TOTAL 33 34 27 6 100
La lectura de esta tabla es sencilla. Por ejemplo: hanría 7 familias que tendrían
1 hijo y 2 hijas y ninguna familia tendría 3 hijos y 3 hijas.
TABLA BIDIMENSIONAL (O CONTINGENCIA):
EJEMPLO – FRECUENCIAS ABSOLUTAS
Sexo (Y)
Masculino Femenino TOTAL
Estado Civil(X)
Soltero 20 40 60
Casado 30 80 110
Viudo 10 5 15
Divorciado 5 10 15
Ejemplo.- Se representa por X el número de hijos de 100 familias y Ejemplo.- Se representa por X el número de hijos de 100 familias y
por Y en número de hijas por Y en número de hijas
• ¿Cómo se interpretan los valores 10 y 20? Hay 10 niños que tienen 7 años y puntuación 125 en el test. Hay 20
niños con puntuación igual a 130.
• ¿Cómo se interpretan los valores 0,110 y 0,220? Hay una proporción de 0,11 niños que tiene 7 años y
puntuación 125 en el test. El 22% de los niños tiene puntuación igual a 120.
TABLA BIDIMENSIONAL (O DE CONTINGENCIA)
Definimos :
Soltero 20 40 60
Casado 30 80 110
Viudo 10 5 15
Divorciado 5 10 15
Distribución marginal de
Distribución marginal de
X (Estado Civil)
Y (Sexo)
DISTRIBUCIONES CONDICIONADAS
A partir de una distribución bidimensional se pueden obtener
distribuciones unidimensionales CONDICIONADAS: de X y de Y.
Distribución de una de las variables siempre que la otra cumpla una condición
específica.
TABLAS BIDIMENSIONALES PARA DOS VARIABLES
CUALITATIVAS.
La distribución de los «n» individuos,
considerando las dos características,
se puede presentar en una tabla de
doble entrada o en una tabla
bidimensional, llamada
habitualmente TABLA DE
CONTINGENCIA, donde los niveles de
una de las variables ocupan la
posición de las filas y los niveles de la
otra variable ocupan la posición de
las columnas y los valores dentro de
la tabla o celdas son las frecuencias
absolutas conjuntas.
TABLA DE CONTINGENCIA: INTERPRETACIÓN
Tabla1. Nivel de instrucción por región de procedencia
Nivel de estudios
Región
de Primaria Secundaria Superior Total
proceden
cia n % n % n %
Costa 40 10.7 80 21.3 60 16 180 48
Sierra 35 9.3 35 9.3 30 8 100 26.7
Selva 30 8 40 10.7 25 6.7 95 25.3
Total 105 28 155 41.3 115 30.7 375 100
• Del grupo de personas encuestadas, 180 son de la costa y 40 (10.7%) de ellos tienen grado de instrucción
primaria, 80 (21.3%) tienen secundaria y el 16% alcanzaron estudios superiores, ….
• En relación al nivel de estudios alcanzados, mayormente es secundaria, el 21.3% tienen primaria y son
de la costa, el 10.7% tienen secundaria y son de la selva……
• Estos resultados indican que el mayor porcentaje de personas con nivel de estudios superiores son de la
costa, lo cual demuestra que hay asociación o dependencia en el nivel de estudios alcanzado por la región
de procedencia de las personas.
TABLAS BIDIMENSIONALES PARA UNA VARIABLE CUALITATIVA Y UNA
VARIABLE DISCRETA.
La tabulación de una
variable cualitativa y otra
variable cuantitativa
discreta se realiza
siguiendo la misma
metodología que en el caso
de dos variables
cualitativas.
TABLAS BIDIMENSIONALES PARA VARIABLES
CUANTITATIVAS.
Cuando se desea construir la tabla de Ejemplo:
frecuencias para dos variables Se ha recolectado la estatura (X) en cm y su
cuantitativas, se hace necesario de peso (Y) en kg de un grupo de estudiantes
cuyos resultados se muestran en la tabla de
acuerdo con el interés del distribución de frecuencias bidimensionales.
investigador plantear previamente
los intervalos de clase. Se
representan con Xi y Yj los
correspondientes intervalos y la
estructura de las frecuencias
absolutas y relativas conjuntas son
similares a la ya presentada para el
caso de dos variables cualitativas.
Ejercicio de aplicación:
Estaciones de medición ambiental
En Andalucía existe una red de más de 60 estaciones
de medida que se encargan de controlar los niveles
de SO2(dióxido de asufre), partículas en suspensión, NO2
(dióxido de nitrógeno) y Ozono en aire.
Y
y 1 =0 y 2 =1 y 3 =2 y 4 =3 y 5 =4
x1=0
x2=1
X
x3=2
x4=3
Rellenar la tabla es sencillo. Tan sólo tenemos que contar cuántas veces se repite cada
pareja de valores, y escribirlo en la casilla correspondiente.
Por ejemplo, el primer dato que tenemos es (0,3), que aparece 2 veces en total.
En la casilla correspondiente a X=0 e Y=3 escribimos el valor 2.
Y
y 1 =0 y 2 =1 y 3 =2 y 4 =3 y 5 =4
x1=0 2
x2=1
X
x3=2
x4=3
Si repetimos el proceso con todos los datos, obtendremos
la siguiente tabla:
(0,3) (1,1) (0,2) (1,1) (2,0) (1,4)
(1,4) (3,2) (3,3) (2,1) (1,4) (1,0)
(0,0) (0,3) (1,3) (1,4) (0,0) (1,0)
(0,0) (2,3) (2,0) (1,0) (0,0) (1,1)
(3,2) (3,1) (0,0) (1,2) (0,1) (0,2)
(0,0) (3,1) (2,3) (1,0) (0,0) (1,4)
Y
y 1 =0 y 2 =1 y 3 =2 y 4 =3 y 5 =4
x1=0 7 1 2 2 0
x2=1 4 3 1 1 5
X
x3=2 3 0 0 2 0
x4=3 0 2 2 1 0
La tabla se completa con una última fila y una última columna en las
que ponemos los totales para cada x i e yj. A estos totales les
llamaremos sumas parciales. Observa que la última casilla tiene que
coincidir con el total de parejas.
Y
y 1 =0 y 2 =1 y 3 =2 y 4 =3 y 5 =4 fi
x1=0 7 1 2 2 0 12
x2=1 4 3 1 1 5 14
X x3=2 3 0 0 2 0 5
x4=3 0 2 2 1 0 5
fj 14 6 5 6 5 36
Ejercicio de aplicación 2:
La siguiente distribución corresponde a 210 ciudadanos considerando su opinión ciudadana
agrupada en tres categorías (a favor, en contra e indeciso) en la construcción de una
autopista según su sexo.
TABLA N° 01
Distribución bidimensional de ciudadanos por sexo según opinión
Opinión (Y)
Sexo (X) A favor En contra Indeciso TOTAL
Hombres 41 39 20 100
Mujeres 40 43 27 110
Total 81 82 47 210
Se pide:
a) Construir las distribuciones de frecuencia marginales para las variables X e Y.
Además Interpretar: f2. y f.3
b) Construir las distribuciones de frecuencias relativas bidimensionales para las variables X e Y.
además interpretar: f22 y f23
c) Construir las distribuciones de frecuencias relativas marginales X e Y respectivamente.
Además interpretar: h1. y h.3
Se pide:
a) Construir las distribuciones de frecuencia marginales para las variables X e Y.
Además Interpretar: f2. y f.3
Interpretación: TABLA N° 01
f2. : Del total de 210 encuestados,
entre varones y mujeres, 110 son A favor En contra Indecisos Total
mujeres. Hombres 41 39 20 100
f.3 : Del total de 210 encuestados que Mujeres 40 43 27 110
opinaron de la construcción de la Total 81 82 47 210
autopista, 47 están indecisos.
TABLA N° 02 TABLA N° 03
Distribución Marginal de X Distribución Marginal de Y
Sexo Opinión
Sexo Nº de Opinión Nº de
Xi encuestados Yj encuestados
Hombres
A favor 81
100
En contra 82
Mujeres 110 Indeciso 47
Total 210 Total 210
b) Construir las distribuciones de frecuencias relativas bidimensionales
para las variables X e Y. además interpretar: f22 y f23
TABLA N° 04
Distribución bidimensional de frecuencias relativas por sexo según opinión
Opinión (Y)
Sexo (X) TOTAL
INTERPRETACIÓN:
f22: El 20.5% de los encuestados son mujeres y opinaron en contra.
f23 : El 12.9% de los encuestados son mujeres y opinaron que están indecisas.
c) Construir
las distribuciones de frecuencias relativas marginales X
e Y respectivamente. Además interpretar: h1. y h.3
TABLA N° 05 TABLA N° 06
Distribución Marginal de X Distribución Marginal de Y
Sexo Opinión
Sexo Nº de Opinión Nº de
Xi encuestados Yj encuestados
Hombres
A favor 0.385
0.476
En contra 0.391
Mujeres 0.524 Indeciso 0.224
Total 1.000 Total 1.000
INTERPRETACIÓN:
:h1. El 47.6% de encuestados son hombres.
Talla
(cms) 160 165 168 170 171 175 175 180 180 182
Peso
(kgs) 55 58 58 61 67 62 66 74 79 83
Ajustes lineales
GRAFICOS DE
BARRAS PARA
UNA VARIABLE
CUALITATIVA Y
UNA VARIABLE
CUANTITATIVA
GRAFICO DE
BARRAS PARA
DOS VARIABLES
CUANTITATIVAS
EJERCICIO POR RESOLVER:
Se ha recolectado la estatura (X) en cm y su peso (Y) en kg de un
grupo de estudiantes cuyos resultados se muestran en la tabla de
distribución de frecuencias bidimensionales.
Estatura en Peso en kg
cm [50, 60> [60, 70> [70, 80>
[160, 165> 12 18 3
[165, 170> 15 25 8
[170, 175> 4 10 5
[175, 180> 1 3 10
Ejm.:
Supongamos esta
tabla que muestra
las ventas (S/.) del
año de las tres
Sucursales de una
determinada
empresa.
GRAFICO DE BARRAS APILADAS