Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tarea 2 - DescBidi - Anhelina Spizhavka Shcherbak
Tarea 2 - DescBidi - Anhelina Spizhavka Shcherbak
ESTADISTICA DESCRIPTIVA
BIDIMENSIONAL
ALUMNA: ANHELINA SPIZHAVKA SHCHERBAK
Contenido:
1
1. Distribuciones de frecuencia bidimensionales: Tablas de frecuencias
de doble entrada
Las tablas de frecuencia de doble entrada permiten estudiar la relación existente entre
dos variables cuantitativas, dos variables cualitativas o una variable cuantitativa y una
cualitativa. En ellas se incluyen frecuencias conjuntas (absolutas y relativas),
frecuencias marginales (absolutas y relativas) y opcionalmente frecuencias
condicionales (por filas o por columnas)
2
Los resultados obtenidos se han almacenado en el fichero PRACDESCBID que se
encuentra en el directorio habitual o en la red
a) Construir una tabla de frecuencias de doble entrada que recoja las frecuencias
conjuntas y marginales de las variables ALTCOD y PESOCOD. ¿Cómo se
interpretan los valores de la tabla? ¿Y el total de la primera fila y de la primera
columna?
Esta tabla muestra con qué frecuencia se presentan los 4 valores de ALTCOD junto con
cada uno de los 4 valores de PESOCOD. El primer número de cada celda es el
recuento o frecuencia. El segundo valor muestra el porcentaje de toda la tabla que
representa esa celda. Por ejemplo, hubo 10 veces en las que ALTCOD es igual a 150-
160 y PESOCOD es igual a 40-60. Esto representa el 7,63% del total de las 131
observaciones. Es decir, hay 10 alumnos (7,63%) que cumplen la doble condición de
que su peso y altura están en esas mismas casillas. Otro ejemplo de la tabla sería que
3
27 alumnos pesan entre 60 y 70 kg y miden entre 170-180 cm (frecuencia absoluta →
27, frecuencia conjunta relativa 20,61%).
Esta tabla muestra con qué frecuencia se presentan los 4 valores de ALTCOD junto con
cada uno de los 4 valores de PESOCOD. El primer número de cada celda es el
recuento o frecuencia. El segundo número muestra el porcentaje de esa celda relativo a
la fila a la que pertenece. Por ejemplo, hubo 10 veces en las que ALTCOD es igual a
150-160 y PESOCOD es igual a 40-60. El valor de 83,33% es la frecuencia condicional
del peso para un grupo de estatura. Ese 83,33% de los alumnos que miden entre 150-
160 cm, nos quiere decir que si solo tuviéramos un alumno, que midiera entre esos
calores, el 83,33% pesaría entre 40-60 kg.
4
Los valores nos indican que si tuviésemos un alumno que pesase entre 40-60 kg, el
23,81% de las veces mediría entre 150-160 cm.
30
25
frecuencia
20
15
10
5
80-99
0 70-80
150-160 160-170 60-70
170-180 180-210 40-60PESOCOD
ALTCOD
5
Ejercicio 2: Tabla de frecuencias para dos variables cualitativas.
6
c) ¿Que gráfico es el que ayuda mejor a realizar comparaciones?
7
d) ¿Qué conclusiones podemos sacar a partir de este gráfico? (qué grupos políticos se
parecen más, que les diferencia...)
Para resaltar mayores diferencias, en las siguientes gráficas que relacionan el bando
político con el transporte utilizado, se ha podido extraer como conclusión que los
votantes de derechas suelen desplazarse mayoritariamente en coche, mientras que los
votantes de izquierdas se desplazan por su propio pie o mediante el uso del transporte
público. Son los votantes del centro y de derechas los que más se asemejan tanto en
transporte utilizado como en qué consideran que sería el principal problema social por
tratar.
TRANSPCOD
CENTRO ANDANDO
COCHE
COMPAÑERO
MOTO/BICI
DERECHAS TRANSP.PUBLICO
IZQUIERDAS
PASA
POLITCOD
CENTRO
DERECHAS
IZQUIERDAS
PASA
ANDANDO COCHECOMPAÑERO
MOTO/BICI
TRANSP.PUBLICO
8
2. Estudio por subgrupos: Diagrama de Box-Whisker múltiple
El estudio comparativo de una variable continua por subgrupos dentro de una muestra
se plantea como un estudio de la distribución condicional de la variable continua
considerada para los distintos valores de una variable discreta que indica la
pertenencia a un grupo concreto.
En la siguiente tabla se puede observar que la gente que tiene un peso entre 150-160
kg, su promedio corresponde en 53 kg, su desviación típica es de 6,39, el coeficiente de
variación 12,068%, el peso mínimo es de 45 kg, el peso máximo es de 56 kg y que por
lo tanto el rango es de 11 kg. Además, para aquellos que miden entre 160-170 cm se
puede observar como hay un sesgo de 2,56 el cual está fuera del rango.
9
En la siguiente gráfica se observa que hay 4 cajas de bigote, donde cada una
corresponde a una altura. Observamos que para la caja de 150-160 cm, nos indica el
promedio por medio de la cruz representada y que este valor corresponde
aproximadamente a 50 kg (53 kg para ser más exacto según la tabla extraída en el
apartado anterior). Su rango va desde 45 a 65 kg.
10
b) Obtener un diagrama de Box-Whisker múltiple para las 3 mezclas
11
La primera y la tercera tienen asimetría positiva, mientras que la segunda presenta
asimetría negativa.
3. Diagrama de dispersión
12
Se ve una relación aproximadamente lineal enre peso y alura, sin embargo no se puede
considerar muy fuerte a causa de la separación que hay entre los puntos de los bordes.
Existe una relación lineal positiva, vemos que a más altura más peso.
Statgraphics: Para etiquetar los puntos del gráfico en función de una tercera variable,
seleccionar con el botón derecho del ratón Opciones de Ventana y en el campo Código
de Puntos introducir la variable diferenciadora (SEXCOD).
Lo que llama la atención de la gráfica representada es que los hombres tienden a ser
más altos que las mujeres.
Statgraphics: Para seleccionar parte de la muestra utilizar el botón del Statfolio para
seleccionar variable e indicar un filtro
13
Como se puede observar, los punos no presenan una relación lineal por lo que podemos
concluir que no tienen aparentemente ninguna relación ya que para una misma edad
observamos alturas muy diferentes. Existe una relación no lineal.
4. Covarianza y correlación
14
Entre el peso y la estatura la covarianza es mucho mayor por lo que podemos decir que
existe mayor covarianza. No obstante, como depende de las unidades, no podemos
concluir ninguna solución acertada. Observamos que existe una relación lineal
positiva.
En la siguiente matriz observamos que las variables que tienen un coeficiente próxima
a 1 es debido a que tienen una relación fuerte. Si las variables tienen un valor próximo
a 0 significa que no tienen ninguna relación. Observamos que hay una relación lineal
positiva en peso frente a la altura, ya que la correlación es positiva y además cercana a
1. Todo aquel valor que se menor a 0,05 significa que existe una correlación real a
nivel población.
15