Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística I
Guió Pràctica 5 d’Excel
El objetivo de esta práctica es el cálculo de las tablas de frecuencias conjuntas y condicionadas. También la
representación gráfica de dichas tablas, así como el cálculo de los estadísticos para medir la relación lineal
entre variables.
1. Calcula la tabla de frecuencias absolutas conjuntas para las variables sexo y motivo del viaje
para la muestra de Agosto de 2016.
En la pestaña Insertar seleccionamos Tabla dinámica, seleccionamos las celdas con los datos
incluyendo el nombre de las variables (podemos seleccionar solo SEXO y MOTIV, o todas, y
luego en la tabla seleccionar las variables de interés). Arrastramos la variable SEXO al
campo de Columnas y la variable MOTIV al campo de Filas (o al revés). Finalmente
arrastramos una de las dos al campo de Valores. Nos aseguramos que en campo de valores
aparece cuenta y no suma. Si no fuese así, pinchamos sobre suma con el derecho del ratón y
seleccionamos Configuración de campo de valor y seleccionamos cuenta (si alguna celda
parece sin número eso implica que la frecuencia absoluta es 0). Así podemos comprobar, que
el número de viajes realizados por mujeres por motivos culturales fueron 405
3. Calcula la tabla de frecuencias relativas de la variable MOTIV condicionada a cada posible valor de
SEXO.
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel
4. Calcula la tabla de frecuencias relativas de la variable MOTIV condicionada a cada posible valor de
PAISDEST.
En el menú de la tabla dinámica anterior pinchamos en campo de Valores y configuración de campo
de valor, o en la celda de cuenta (en la misma tabla dinámica) y configuración de campo de valor, en
la ventana emergente pinchamos en Muestra los valores como, y seleccionamos % del total de la fila
(si la variable PAISDEST va en las Filas) y % del total de la columna (si la variable PAISDEST va en
las Columnas).
Así podemos concluir, que entre los hombres, el 10.72% viaja por motivos de naturaleza, mientras
que entre las mujeres, son el 10.32% las que viajan por motivos de naturaleza. Ambos porcentajes son
prácticamente iguales.
En la tabla anterior tenemos la distribución del motivo de viaje condicionada al sexo (en la columna
B la distribución del motivo condicionado a que el viaje lo hace un hombre; en la columna C la
distribución del motivo condicionado a que el viaje lo hace una mujer) y tenemos la distribución
marginal del motivo de viaje (columna D). Para que el motivo del viaje sea independiente del sexo de
la persona que realiza el viaje, se tendría que cumplir que esas tres columnas sean iguales (dado que
las distribuciones están en términos de las frecuencias relativas). En la medida en que en alguna de
las filas las columnas sean diferentes, esas dos variables no serán independientes. Cuanto más
diferentes sean, más evidente será relación entre las variables.
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel
En este caso particular, las columnas no son iguales, pero si son parecidas. Las mayores diferencias
relativas se encuentran en el motivo deportivo, de bienestar y gastronómico. En particular, el % de
hombres que viaja por motivo deportivo es más del doble que el de las mujeres.
Podemos hacer el mismo análisis si en vez de calcular la distribución del motivo condicionada al
sexo, calculamos la del sexo condicionada al motivo del viaje. Para ello en vez del % del total de
columnas deberíamos seleccionar en Mostrar valores como el % del total de filas:
En este caso para cada fila (desde la 5 hasta la 11) tenemos la distribución del sexo condicionada a
cada uno de los motivos del viaje. En la fila 12 tenemos la distribución marginal del sexo. Para que
las variables fuesen independientes en cada una de las columnas los valores de cada fila deberían ser
iguales, o como en el caso anterior, cuanto más diferentes sean más evidente será la relación entre
las variables.
Podemos ver que en Agosto viajan más mujeres que hombres. El 52.58% de los que viajan son
mujeres, y el 47.42% hombres. Estos porcentajes se mantienen aproximadamente cuando
condicionamos a los motivos, Sol y playa, Naturaleza u Otros motivos. Sin embargo para los motivos
Gastronómico, Deportivo o de Bienestar cambian mucho. Así podemos comprobar que el % de
hombres es mucho mayor de lo habitual si nos fijamos en los viajes por motivos deportivo (73.81%
frente a 47.42%) mientras que en las mujeres es menor (26.19% frente al 52.58%). Al revés sucede si
nos fijamos en los viajes por motivos de Bienestar.
Por lo tanto podemos concluir que el sexo y el motivo del viaje no son independientes.
6. Calcula una variable que recoja el porcentaje de gasto dedicado a bares y restaurantes para el mes de
Octubre de 2016 (divide el gasto final en bares y restaurante entre el gasto final total, y multiplícalo
por 100). Calcula la tabla de frecuencias conjuntas para las variables Porcentaje de gasto en bares y
restaurantes y Edad. Agrupa la primera variable en intervalos de amplitud 15 y la segunda en
intervalos de amplitud 10 años.
Para crear la nueva variable, en una columna vacía de la hoja Octubre 20016 (en nuestro caso la
columna K). En la celda K1 escribimos el nombre de la nueva variable (por ejemplo
Por_GASTOFI_BAREST). En la celda K2 escribimos la función 100*(G2/H2), a continuación
copiamos la formula en el resto de celdas correspondientes.
Seleccionamos todas las variables (incluyendo por lo menos la variable EDAD y la nueva variable
creada) y actuamos como en el punto 1 (para simplificar mejor poner EDAD en Columnas y Por_
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel
GASTOFI_BAREST en filas). Para agrupar los datos, nos ponemos sobre una celda con un gasto y
pinchamos con el derecho del ratón, seleccionamos agrupar, escribimos que empiece en 0 y en por
ponemos 15. Sobre una celda con una Edad pinchamos con el ratón, seleccionamos agrupar y
escribimos que empiece por 15 y en por ponemos 10.
7. Representa gráficamente el histograma con las frecuencias relativas conjuntas de ambas variables.
Primero calculamos las frecuencias relativas como en el punto dos. Para hacer el gráfico
seleccionamos la tabla dinámica, y en Herramientas de Tabla dinámica, Analizar, seleccionamos
Gráfico dinámico, Columna, y Columnas 3D (en Mac es posible que no podamos hacerlo
directamente, como se indicaba en la pregunta 2). En Herramientas de Gráfico Dinámico, Diseño,
presentación rápida seleccionamos la presentación 8, que junta las columnas. Seleccionamos el resto
de opciones para que el gráfico sea autocontenido.
8. Calcula la tabla de frecuencias conjuntas para las variables Edad y número de pernoctaciones para la
muestra del mes de Agosto de 2016. El nº de pernoctaciones agrúpalo en los siguientes intervalos: 1,
2,(2,7],(7,30], (30,365]. La edad agrúpala en intervalos de amplitud 10.
Actuamos como en el punto 5. Sin embargo para agrupar la variable NPERNOC, seleccionamos los
valores 3 hasta 7 y con el derecho del ratón seleccionamos agrupar. Seleccionamos a continuación
los valores 8 hasta 30 y con el derecho del ratón seleccionamos agrupar. Finalmente seleccionamos
el resto de valores y de nuevo con el derecho del ratón seleccionamos agrupar. Eliminamos
NPERNOC del cuadro de Filas (o Columnas) y nos quedamos con NPERNOC2. Para cambiar
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel
9. En base a dicha tabla calcule el porcentaje de viajes que duran una semana o menos y son realizados
por personas de más de 75 años. De los viajes realizados por personas de menos de 25 años ¿qué
porcentaje de viajes duran dos días?
Para responder la primera pregunta necesitamos las frecuencias relativas conjuntas. Para obtener
las frecuencias relativas actuamos como en los casos anteriores, en Configuración de campo de valor,
Mostrar valores como, % del total general. La respuesta será la suma de las frecuencias relativas
conjuntas de {1, [75,85]},{2,[75,85]} y {(2,7],[75,85]},=0.26+0.78+0.98=2.02%.
La segunda viene dada por la frecuencia relativa de NPERNOC=2 condicionado a que EDAD<25
años. Para obtener esta distribución condicionada, en la misma tabla en Configuración de campo de
valor, Mostrar valores como, % del total de columnas. La respuesta es 18.85%.
10. Volviendo a los datos originales de Agosto de 2016, ¿Cuál es el nº de pernoctaciones totales realizadas
por los viajes de los menores de 25 años? ¿Qué porcentaje representan respecto de todas las
pernoctaciones realizadas en Agosto de 2016?
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel
Para responder a esta pregunta necesitamos saber el nº de pernoctaciones realizadas en los viajes de
los menores de 25 años y el nº total de pernoctaciones realizadas en todos los viajes. Para obtener
dichos valores en el cuadro de opciones de la tabla dinámica anterior llevamos al cuadro Valores
NPERNOC, y nos aseguramos que nos presente la Suma de NPERNOC. De esta forma, en vez de las
frecuencias tendremos la suma o las pernoctaciones realizadas por cada clase. Así por ejemplo, el nº
de pernoctaciones realizadas por los menores de 25 años cuyos viajes duran más de un mes, suman
395. El número de pernoctaciones totales realizadas por los menores de 25 son 3361. El número de
pernoctaciones de todos los viajes realizados en agosto de 2016 son 41987. Por lo tanto las
pernoctaciones realizadas por los menores de 25 años representan el 8.0049%
11. Calcula la media y la varianza del Gasto final total condicionadas a que NPERNOC es igual a 1, es
igual a 2, pertenece al intervalo (2,7], pertenece al intervalo (7,31] y es mayor que 31 para el mes de
Agosto de 2016.
Primero creamos una tabla dinámica con las variables Gasto final total y NPERNOC, agrupando la
variable NPERNOC en los intervalos 1, 2,(2,7],(7,30], (30,365]. En segundo lugar, al campo valores
llevamos la variable Gasto final total, y asegurándonos que obtenemos el promedio del Gasto final
total (en Configuración de campo de valor, en Resumir valores por seleccionamos promedio).
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel
De esta forma obtenemos la media aritmética y la varianza del Gasto Final Total condicionado a
cada intervalo de NPERNOC.
12. Calcule la covarianza y el coeficiente de correlación entre la variable NPERNOC y las variables
relacionadas con el Gasto Final para el mes de Agosto de 2016. ¿Cómo es la relación entre estas
variables? ¿Para qué tipo de gasto podemos considerar que hay una mayor relación lineal?
Facultat d’Economia i Empresa
Estadística I
Guió Pràctica 5 d’Excel
Para calcular la covarianza entre NPERNOC y GASTOFI_ALOJA (por ejemplo) usaremos la función
de Excel COVARIANCE.P(;) (COVARIANÇA en catalán), que tiene dos argumentos. El primer
argumento es el conjunto de valores de la primera variable, y el segundo el conjunto de valores de la
segunda variable. En este caso escribiríamos COVARIANCE.P(D:D;E:E). El resto de covarianzas se
obtienen de forma equivalente sustituyendo la columna E por la columna correspondiente. Para el
calculo de la función de correlación de Excel, COEF.DE.CORREL(;) (COEF.CORREL en catalán),
que tiene los mismos argumentos que la función COVARIANCE.P. La mayor relación lineal parece
darse con el Gasto en Bares y Restaurantes, 0.4766.
13. Represente el diagrama de dispersión de las variables NPERNOC y el GASTOFI_TOTAL para los
viajes realizados por motivo cultural en el mes de Agosto de 2016.
Podemos ver como la nube de puntos señala una relación positiva entre el número de pernoctaciones
y el gasto total final. También podemos ver como la dispersión de los puntos es mayor a medida que
aumentamos el número de pernoctaciones.