Está en la página 1de 12

Facultat d’Economia i Empresa

Estadística I
Guió Pràctica 5 d’Excel

El objetivo de esta práctica es el cálculo de las tablas de frecuencias conjuntas y condicionadas. También la
representación gráfica de dichas tablas, así como el cálculo de los estadísticos para medir la relación lineal
entre variables.

1. Calcula la tabla de frecuencias absolutas conjuntas para las variables sexo y motivo del viaje
para la muestra de Agosto de 2016.

En la pestaña Insertar seleccionamos Tabla dinámica, seleccionamos las celdas con los datos
incluyendo el nombre de las variables (podemos seleccionar solo SEXO y MOTIV, o todas, y
luego en la tabla seleccionar las variables de interés). Arrastramos la variable SEXO al
campo de Columnas y la variable MOTIV al campo de Filas (o al revés). Finalmente
arrastramos una de las dos al campo de Valores. Nos aseguramos que en campo de valores
aparece cuenta y no suma. Si no fuese así, pinchamos sobre suma con el derecho del ratón y
seleccionamos Configuración de campo de valor y seleccionamos cuenta (si alguna celda
parece sin número eso implica que la frecuencia absoluta es 0). Así podemos comprobar, que
el número de viajes realizados por mujeres por motivos culturales fueron 405

2. Representa gráficamente la distribución de frecuencias relativas conjuntas de ambas variables


para dicho mes.

En el menú de la tabla dinámica anterior pinchamos en campo de Valores y configuración de


campo de valor, o en la celda de cuenta (en la misma tabla dinámica) y configuración de
campo de valor, en la ventana emergente pinchamos en Muestra los valores como, y
seleccionamos % del total general. Así obtenemos las frecuencias relativas conjuntas. Así
podemos comprobar que el 7.95% de los viajes realizados en Agosto los realizaron mujeres
por motivos culturales.

Para hacer el gráfico seleccionamos la tabla dinámica, y en Herramientas de Tabla


dinámica, Analizar, seleccionamos Gráfico dinámico, Columna, y Columnas 3D. En
Herramientas de Gráfico Dinámico, Diseño seleccionamos las opciones para que el gráfico
sea autocontenido. Para que aparezcan los valores originales de las variables y no los
codificados debemos sobre escribirlos en la tabla dinámica.
Igual que en las prácticas anteriores, el gráfico se puede crear sin usar las herramientas de
la tabla dinámica (una alternativa para algunos usuarios de Mac). Simplemente
seleccionamos y/o copiamos (como valores) las celdas a representar de la tabla dinámica, y
en la pestaña de INSERTAR pinchamos en Gráficos recomendados y a partir de aquí
seguimos los mismos pasos que antes.
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel

3. Calcula la tabla de frecuencias relativas de la variable MOTIV condicionada a cada posible valor de
SEXO.
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel

En el menú de la tabla dinámica anterior pinchamos en campo de Valores y configuración de


campo de valor, o en la celda de cuenta (en la misma tabla dinámica) y configuración de
campo de valor, en la ventana emergente pinchamos en Muestra los valores como, y
seleccionamos % del total de la columna (si la variable MOTIV va en las Filas) y % del total
de la fila (si la variable MOTIV va en las Columnas).

4. Calcula la tabla de frecuencias relativas de la variable MOTIV condicionada a cada posible valor de
PAISDEST.
En el menú de la tabla dinámica anterior pinchamos en campo de Valores y configuración de campo
de valor, o en la celda de cuenta (en la misma tabla dinámica) y configuración de campo de valor, en
la ventana emergente pinchamos en Muestra los valores como, y seleccionamos % del total de la fila
(si la variable PAISDEST va en las Filas) y % del total de la columna (si la variable PAISDEST va en
las Columnas).

Así podemos concluir, que entre los hombres, el 10.72% viaja por motivos de naturaleza, mientras
que entre las mujeres, son el 10.32% las que viajan por motivos de naturaleza. Ambos porcentajes son
prácticamente iguales.

5. ¿Qué conclusión podemos obtener referente a la independencia entre ambas variables?

En la tabla anterior tenemos la distribución del motivo de viaje condicionada al sexo (en la columna
B la distribución del motivo condicionado a que el viaje lo hace un hombre; en la columna C la
distribución del motivo condicionado a que el viaje lo hace una mujer) y tenemos la distribución
marginal del motivo de viaje (columna D). Para que el motivo del viaje sea independiente del sexo de
la persona que realiza el viaje, se tendría que cumplir que esas tres columnas sean iguales (dado que
las distribuciones están en términos de las frecuencias relativas). En la medida en que en alguna de
las filas las columnas sean diferentes, esas dos variables no serán independientes. Cuanto más
diferentes sean, más evidente será relación entre las variables.
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel

En este caso particular, las columnas no son iguales, pero si son parecidas. Las mayores diferencias
relativas se encuentran en el motivo deportivo, de bienestar y gastronómico. En particular, el % de
hombres que viaja por motivo deportivo es más del doble que el de las mujeres.

Podemos hacer el mismo análisis si en vez de calcular la distribución del motivo condicionada al
sexo, calculamos la del sexo condicionada al motivo del viaje. Para ello en vez del % del total de
columnas deberíamos seleccionar en Mostrar valores como el % del total de filas:

En este caso para cada fila (desde la 5 hasta la 11) tenemos la distribución del sexo condicionada a
cada uno de los motivos del viaje. En la fila 12 tenemos la distribución marginal del sexo. Para que
las variables fuesen independientes en cada una de las columnas los valores de cada fila deberían ser
iguales, o como en el caso anterior, cuanto más diferentes sean más evidente será la relación entre
las variables.
Podemos ver que en Agosto viajan más mujeres que hombres. El 52.58% de los que viajan son
mujeres, y el 47.42% hombres. Estos porcentajes se mantienen aproximadamente cuando
condicionamos a los motivos, Sol y playa, Naturaleza u Otros motivos. Sin embargo para los motivos
Gastronómico, Deportivo o de Bienestar cambian mucho. Así podemos comprobar que el % de
hombres es mucho mayor de lo habitual si nos fijamos en los viajes por motivos deportivo (73.81%
frente a 47.42%) mientras que en las mujeres es menor (26.19% frente al 52.58%). Al revés sucede si
nos fijamos en los viajes por motivos de Bienestar.
Por lo tanto podemos concluir que el sexo y el motivo del viaje no son independientes.

6. Calcula una variable que recoja el porcentaje de gasto dedicado a bares y restaurantes para el mes de
Octubre de 2016 (divide el gasto final en bares y restaurante entre el gasto final total, y multiplícalo
por 100). Calcula la tabla de frecuencias conjuntas para las variables Porcentaje de gasto en bares y
restaurantes y Edad. Agrupa la primera variable en intervalos de amplitud 15 y la segunda en
intervalos de amplitud 10 años.

Para crear la nueva variable, en una columna vacía de la hoja Octubre 20016 (en nuestro caso la
columna K). En la celda K1 escribimos el nombre de la nueva variable (por ejemplo
Por_GASTOFI_BAREST). En la celda K2 escribimos la función 100*(G2/H2), a continuación
copiamos la formula en el resto de celdas correspondientes.

Seleccionamos todas las variables (incluyendo por lo menos la variable EDAD y la nueva variable
creada) y actuamos como en el punto 1 (para simplificar mejor poner EDAD en Columnas y Por_
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel

GASTOFI_BAREST en filas). Para agrupar los datos, nos ponemos sobre una celda con un gasto y
pinchamos con el derecho del ratón, seleccionamos agrupar, escribimos que empiece en 0 y en por
ponemos 15. Sobre una celda con una Edad pinchamos con el ratón, seleccionamos agrupar y
escribimos que empiece por 15 y en por ponemos 10.

7. Representa gráficamente el histograma con las frecuencias relativas conjuntas de ambas variables.

Primero calculamos las frecuencias relativas como en el punto dos. Para hacer el gráfico
seleccionamos la tabla dinámica, y en Herramientas de Tabla dinámica, Analizar, seleccionamos
Gráfico dinámico, Columna, y Columnas 3D (en Mac es posible que no podamos hacerlo
directamente, como se indicaba en la pregunta 2). En Herramientas de Gráfico Dinámico, Diseño,
presentación rápida seleccionamos la presentación 8, que junta las columnas. Seleccionamos el resto
de opciones para que el gráfico sea autocontenido.

8. Calcula la tabla de frecuencias conjuntas para las variables Edad y número de pernoctaciones para la
muestra del mes de Agosto de 2016. El nº de pernoctaciones agrúpalo en los siguientes intervalos: 1,
2,(2,7],(7,30], (30,365]. La edad agrúpala en intervalos de amplitud 10.

Actuamos como en el punto 5. Sin embargo para agrupar la variable NPERNOC, seleccionamos los
valores 3 hasta 7 y con el derecho del ratón seleccionamos agrupar. Seleccionamos a continuación
los valores 8 hasta 30 y con el derecho del ratón seleccionamos agrupar. Finalmente seleccionamos
el resto de valores y de nuevo con el derecho del ratón seleccionamos agrupar. Eliminamos
NPERNOC del cuadro de Filas (o Columnas) y nos quedamos con NPERNOC2. Para cambiar
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel

Grupo1, Grupo2,… pinchamos en la celda correspondiente y escribimos directamente el intervalo


(0,2], (2,7],…

9. En base a dicha tabla calcule el porcentaje de viajes que duran una semana o menos y son realizados
por personas de más de 75 años. De los viajes realizados por personas de menos de 25 años ¿qué
porcentaje de viajes duran dos días?

Para responder la primera pregunta necesitamos las frecuencias relativas conjuntas. Para obtener
las frecuencias relativas actuamos como en los casos anteriores, en Configuración de campo de valor,
Mostrar valores como, % del total general. La respuesta será la suma de las frecuencias relativas
conjuntas de {1, [75,85]},{2,[75,85]} y {(2,7],[75,85]},=0.26+0.78+0.98=2.02%.

La segunda viene dada por la frecuencia relativa de NPERNOC=2 condicionado a que EDAD<25
años. Para obtener esta distribución condicionada, en la misma tabla en Configuración de campo de
valor, Mostrar valores como, % del total de columnas. La respuesta es 18.85%.

10. Volviendo a los datos originales de Agosto de 2016, ¿Cuál es el nº de pernoctaciones totales realizadas
por los viajes de los menores de 25 años? ¿Qué porcentaje representan respecto de todas las
pernoctaciones realizadas en Agosto de 2016?
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel

Para responder a esta pregunta necesitamos saber el nº de pernoctaciones realizadas en los viajes de
los menores de 25 años y el nº total de pernoctaciones realizadas en todos los viajes. Para obtener
dichos valores en el cuadro de opciones de la tabla dinámica anterior llevamos al cuadro Valores
NPERNOC, y nos aseguramos que nos presente la Suma de NPERNOC. De esta forma, en vez de las
frecuencias tendremos la suma o las pernoctaciones realizadas por cada clase. Así por ejemplo, el nº
de pernoctaciones realizadas por los menores de 25 años cuyos viajes duran más de un mes, suman
395. El número de pernoctaciones totales realizadas por los menores de 25 son 3361. El número de
pernoctaciones de todos los viajes realizados en agosto de 2016 son 41987. Por lo tanto las
pernoctaciones realizadas por los menores de 25 años representan el 8.0049%

11. Calcula la media y la varianza del Gasto final total condicionadas a que NPERNOC es igual a 1, es
igual a 2, pertenece al intervalo (2,7], pertenece al intervalo (7,31] y es mayor que 31 para el mes de
Agosto de 2016.

Primero creamos una tabla dinámica con las variables Gasto final total y NPERNOC, agrupando la
variable NPERNOC en los intervalos 1, 2,(2,7],(7,30], (30,365]. En segundo lugar, al campo valores
llevamos la variable Gasto final total, y asegurándonos que obtenemos el promedio del Gasto final
total (en Configuración de campo de valor, en Resumir valores por seleccionamos promedio).
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel

A continuación llevamos de nuevo la variable GASTOFI_TOTAL a valores, y esta vez en Resumir


campo de valor por seleccionamos Varp (también podríamos obtener la desviación típica, máximo,
mínimo, el producto…)

De esta forma obtenemos la media aritmética y la varianza del Gasto Final Total condicionado a
cada intervalo de NPERNOC.

12. Calcule la covarianza y el coeficiente de correlación entre la variable NPERNOC y las variables
relacionadas con el Gasto Final para el mes de Agosto de 2016. ¿Cómo es la relación entre estas
variables? ¿Para qué tipo de gasto podemos considerar que hay una mayor relación lineal?
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel

Para calcular la covarianza entre NPERNOC y GASTOFI_ALOJA (por ejemplo) usaremos la función
de Excel COVARIANCE.P(;) (COVARIANÇA en catalán), que tiene dos argumentos. El primer
argumento es el conjunto de valores de la primera variable, y el segundo el conjunto de valores de la
segunda variable. En este caso escribiríamos COVARIANCE.P(D:D;E:E). El resto de covarianzas se
obtienen de forma equivalente sustituyendo la columna E por la columna correspondiente. Para el
calculo de la función de correlación de Excel, COEF.DE.CORREL(;) (COEF.CORREL en catalán),
que tiene los mismos argumentos que la función COVARIANCE.P. La mayor relación lineal parece
darse con el Gasto en Bares y Restaurantes, 0.4766.

Otra posibilidad es usar la herramienta coeficiente de correlación de la pestaña análisis de datos.


Pinchado en dicha herramienta (Datos, Análisis de datos, Covarianza y/o Coeficiente de correlación),
en la ventana emergente escribimos en Rango de entrada las columnas con las variables de las que
queremos obtener los coeficientes de correlación (en este caso $D:$H). Seleccionamos rótulos en la
primera fila, si en la primera fila aparece el nombre de las variables y donde guardamos la salida. El
output es lo que se denota como matriz de covarianzas y/o correlaciones y podemos, no solo obtener
las covarianzas y/o correlaciones de NPERNOC con los distintos gastos, sino también las
correlaciones entre los gastos.
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel

13. Represente el diagrama de dispersión de las variables NPERNOC y el GASTOFI_TOTAL para los
viajes realizados por motivo cultural en el mes de Agosto de 2016.

Ponemos un filtro en la variable MOTIV en la hoja Agosto 2016, y seleccionamos el valor 2.


Seleccionamos la columna de NPERNOC y GASTOFI_TOTAL (apretando la tecla Control para
seleccionar ambas columnas a la vez), copiamos los valores y los copiamos en una hoja nueva.
Seleccionamos ambas variables de nuevo y en la pestaña de INSERTAR, seleccionamos Grafico de
dispersión (X, Y) (el que aparece por defecto en Gráficos recomendados). En diseño seleccionamos
las opciones necesarias para que el gráfico sea auto contenido.
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel

Podemos ver como la nube de puntos señala una relación positiva entre el número de pernoctaciones
y el gasto total final. También podemos ver como la dispersión de los puntos es mayor a medida que
aumentamos el número de pernoctaciones.

También podría gustarte