Está en la página 1de 246

1

. •

Vicente lnglada López de Sabando


César Muñoz Martínez
lucia lnglada-Pér.ez

EJERCICIOS DE TEST
I •
RESUELTOS PARA
INTRODUCCIÓN A LA
ESTADÍSTICA DE
ADMINISTRACIÓN Y
DIRECCIÓN DE EMPRESAS

.....
Un ED ~ EDICIONES ACADÉMICAS
-
«Cualquier forma de reproducción, distribución, comunicación pública o
transformación de esta obra solo puede ser realizada con la autorización de
sus titulares, salvo excepción prevista por la ley. Diríjase a CEDRO (Cen-
tro Español de Derechos Reprográficos) si necesita fotocopiar o escanear
algún fragmento de esta obra (www.conlicencia.com ; 91 702 19 70 I
93 272 04 47)».

© Vicente lnglada López de Sabando


César Munoz Martínez
Lucía lngalda-Pérez

© Ediciones Académicas, S.A.


Bascuñuelos, 13 - P 28021 Madrid

ISBN : 978-84-92477-87-6
Depósito Legal : M-34726-2013

Impreso por: Lavel S.A.

Impreso en España ! Printed in Spain


ÍNDICE

PRÓLOGO
CAPÍTULO l. INTRODUCCIÓN .............................. ..... .. .... .............................. 1
CAPÍTULO 2. DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES ........ 19
2.1. Preguntas Teóricas .................................................................... ..... 19
2.2 . Problemas ..... ...................................................... ....... ........ ............ 25
CAPÍTULO 3. LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES
UNIDIMENSIONALES ................. ............................................................ 37
3.1. Preguntas teóricas ............ ...... ............. ......... .................................. 37
3.2. Problemas .......................... ......................................................... ... 44
CAPÍTULO 4. LAS MEDIDAS DE DISPERSIÓN, DE FORMA Y CONCENTRACIÓN
EN DISTRIBUCIONES UNIDIMENSIONALES.............. ............................... 56
4.1. Preguntas Teóricas ......................................................................... 56
4.2. Problemas .............. ........................................................................ 68
CAPÍTULO 5. DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES.
REGRESIÓN Y CORRELACIÓN ............................................................... 91
5.1. Preguntas Teóricas ................................................ .................... ... .. 91
5.2. Problemas .. .................... ..... .................... .......... ........................... 101
CAPÍTULO 6. NÚMEROS ÍNDICES ..... ............... ............ ........................ .. ..... 129
6.1. Preguntas Teóricas .......... ... ..................... .............. .................. ..... 129
6.2. Problemas ........................ .. ......................................................... . 144
CAPÍTULO 7. SERIES TEMPORALES .... ......................... ........ .................. ..... 169
7.1. Preguntas Teóricas .......... ... ............................. .. ...... ..................... 169
7.2. Problemas ....................... .... ............................ ............................. 179
CAPÍTULO 8. INTRODUCCIÓN A LA PROBABILIDAD .................................... 211
8.1 . Preguntas Teóricas ................. ........................... ... .. ...................... 211
8.2. Problemas .................................................................................... 221
BIBLIOGRAFÍA ......... .............................. ........................ ....... .................... 237
PRÓLOGO

Este libro es un texto de ejerc1c1os de tipo test que complementa el


Manual denominado " Estadística para Administración y Dirección de
Empresas" de la asignatura de Introducción a la Estadística perteneciente
al primer curso del Grado de Administración y Dirección de Empresas de
la UNED.

En los ejercicios resueltos, que son acompañados de la correspondiente


explicación sobre su resolución, se recogen tanto preguntas teóricas
como problemas, siguiendo el modelo de examen de la asignatura, con el
doble objetivo de que el alumno consolide los conocimientos teóricos y
facilitarle la preparación del examen de la asignatura.

Este texto se divide en 8 capítulos y está planteado para que su estudio


pueda ser afrontado por alumnos que sólo dispongan de unos
conocimientos matemáticos elementales.

En los dos primeros capítulos se introduce al alumno en la Ciencia


Estadística y en sus aplicaciones a la dirección y gestión de empresas. El
capítulo primero se complementa con una revisión de las fuentes
estadísticas publicadas en España y que tienen interés y relación directa
con la actividad empresarial y en el segundo capítulo se estudian los
conceptos estadísticos fundamentales y la representación gráfica de las
variables estadísticas.

Los capítulos tercero y cuarto, se dedican, respectivamente, al estudio de


las medidas de posición (media aritmética, geométrica y armónica, moda,
mediana, cuartiles y percentiles) y de las medidas de dispersión (rango o
amplitud, recorrido, rango entre percentiles, recorrido relativo, recorrido
semi-intercuartílico, desviaciones media y mediana, varianza, desviación
típica o estándar, etc.) en las distribuciones unidimensionales.

En el capítulo quinto se aborda el estudio de las distribuciones


bidimensionales, incluyendo sus principales estadísticos descriptivos, y los
conceptos de regresión y de correlación, así como la utilización de los
mismos para el estudio de la dependencia entre variables y para predecir
el comportamiento de variables dependientes.

En el capítulo sexto se estudian los números índices, incidiendo con


especial énfasis en las principales propiedades y las formulaciones de los
índices más habituales (Laspeyres, Paasche y Fisher) y otros menos
utilizados (como el de Edgeworth-Marshall).
En el capítulo séptimo se introduce el concepto de series temporales
estudiando su representación gráfica, el ajuste de tendencias, las
variaciones estacionales y cíclicas y la desestacionalización de las series;
con ello termina la parte dedicada a la Estadística Descriptiva.

Finalmente, en el capítulo octavo se abordan los conceptos básicos de la


teoría de la probabilidad, que son la base para abordar el tercer gran
apartado de la Estadística, la denominada Inferencia Estadística, es decir,
para inferir datos a una población a partir de los resultados extraídos de
una muestra de la misma.

Vicente Inglada López de Sabando


César Muñoz Martínez
Lucia Inglada-Pérez
INTRODUCCIÓN 1

CAPÍTULO 1. INTRODUCCIÓN

T.1.1. Indique cuál de las opciones es falsa.

(a) La diferencia entre variables continuas y atributos consiste en que las


variables continuas toman un número infinito no numerable de valores
mientras que los atributos toman un número finito o infinito numerable de
valores en un intervalo
(b) La diferencia entre variables continuas y discretas consiste en que las
variables continuas son susceptibles de medirse numéricamente mientras
que las discretas no son susceptibles de medirse numéricamente y toman
un número finito o infinito numerable de valores en un intervalo
(c) Cuando los parámetros o características de la población no son
susceptibles de medirse numéricamente reciben el nombre de Atributos
(d) La intención de voto es un atributo

Solución: La opción (a) .

Justificación: La opción (a) es falsa porque cuando los parámetros o


características de la población no son susceptibles de medirse numéricamente
reciben el nombre de Atributos.

T.1.2. Indique cuál de las opciones es verdadera.

(a) Las variables discretas y los atributos no son susceptibles de medirse


numéricamente
(b) La altura de los habitantes censados en una ciudad es una variable
discreta
(c) El peso de los perros de Madrid es una va riable continua
(d) La distancia medida por 100 observadores entre dos ciudades es una
variable discreta

Solución: La opción (c).

Justificación: La opción (a) es falsa porque las variables discretas son


susceptibles de medirse numéricamente. La opción (b) es falsa porque la
altura de las personas es una variable continua. La opción (d) es falsa porque
la distancia entre dos ciudades es una variable continua.

En este tipo de preguntas hay que tener en cuenta que la mayor parte de las
variables continuas pueden tratarse como discretas; así, por ejemplo, si
valoramos la altura de los habitantes de Madrid en cm., despreciando las
unidades menores y la mide una misma persona con el mismo metro, una
2 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

variable que en otras condiciones sería continua podría convertirse en


discreta; lo mismo podríamos pensar para la distancia entre dos puntos; en
general, sin embargo, tal como está expresada la opción (d), la medida de la
distancia entre dos ciudades es una variable continua porque cada observador
seguro que obtiene una medida diferente en kilómetros, metros, etc.

T.1.3. Indique cuál de las opciones es falsa.

(a) Los atributos presentan Modalidades o Categorías


(b) Las variables discretas pueden clasificarse como ordena bles y no
ordena bles
(c) El atributo más simple es el que sólo presenta dos modalidades como
favorable/desfavorable
(d) El nivel de estudios es un atributo ordenable

Solución: La opción (b ).

Justificación: La opción (b) es falsa porque son los atributos quienes pueden
clasificarse como ordenables y no ordenables.

T.1.4. Indique cuál de las opciones siguientes es falsa.

(a) En la serie 2000-2013, el número de viajeros en ferrocarril en Espa ña


durante 2012 es una variable de corte transversal
(b) La serie mensual de parados inscritos en el INEM es una variable temporal
(c) La cifra de beneficios de una empresa durante el primer trimestre de 2012
es una variable temporal
(d) La serie mensual de parados inscritos en el INEM es una variable temporal

Solución: La opción (c).

Justificación: La opción ( c) es falsa porque los beneficios de una empresa


durante el primer trimestre de 2012, tomada fuera de la serie trimestral de
beneficios de la empresa, es una variable de corte transversal o atemporal
(aunque esté referida a un momento o período concreto de tiempo);
recordemos que, como alternativa, las variables temporales o históricas, son
las referidas a distintos momentos del tiempo y adoptan en general la forma
de series.
INTRODUCCIÓN 3

T.1.5. Señale la opción falsa.

(a) La Inferencia Estadística estudia los métodos empleados para inferir algo
acerca de una población basándose en la información aportada por una
parte del colectivo
(b) Los parámetros son las características poblacionales que deseamos
investigar y que suelen ser desconocidas a priori
(c) Las opciones (a) y (b) son verdaderas
(d) Los atributos son las características o parámetros numéricos de la
población y pueden ser discretos o continuos

Solución: La opción (d).

Justificación: La opción (d) es falsa porque los atributos no son las


características o parámetros numéricos de la población .

T.1.6. Indique cuál es la opción falsa.

(a) El número de viajes de trabajo realizados por una persona el último año es
una variable Cuantitativa
(b) El porcentaje de audiencia de los prog ramas de televisión durante la
semana pasada es una variable Cuantitativa
(c) El lugar de nacimiento de los estudiantes de la UNED es una variable
Cuantitativa
(d) El Grado de satisfacción de los clientes con el servicio telefónico es una
variable Cualitativa

Solución: La opción (c).

Justificación: La opción (c) es falsa porque el lugar de nacimiento de los


estudiantes de la UNED es una variable Cualitativa.

T.1.7. En relación con las funciones del EUROSTAT, indique cuál es la


opción falsa.

(a) El EUROSTAT es la oficina estadística de la Comisión Europea


(b) El EUROSTAT produce datos sobre la Unión Europea y promueve la
armonización de los métodos estad ísticos de los estados miembros
(c) La principal función de EUROSTAT es el análisis del tipo de cambio del
euro respecto al dólar
(d) El papel del EUROSTAT es consolidar la información y asegurarse de que
se utiliza una metodología homogénea que asegura su comparabilidad

Solución: La opción (c).


4 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Justificación: La opción ( c) es falsa porque realizar análisis del tipo de cambio


del euro respecto al dólar no es función del EUROSTAT.

T.1 .8. En relación con las funciones del EUROSTAT, indique la opción
verdadera.

(a) El EUROSTAT genera, verifica y analiza sus datos y los envía a las
autoridades estadísticas de los Estados Miembros
(b) El EUROSTAT fija el tipo de interés para los países de la eurozona
( c) Son las autoridades estadísticas de los Estados Miembros las que generan,
verifican y analizan los datos nacionales y los envían a Eurostat
(d) Ninguna de las anteriores es verdadera

Solución: La opción (c).

Justificación: La opción (a) es falsa porque el EUROSTAT no genera, verifica y


analiza sus datos y los envía a las autoridades estadísticas de los Estados
Miembros. La opción (b) es falsa porque el EUROSTAT no fija el tipo de interés
para los países de la eurozona. La opción ( d) es falsa porque la opción ( c) es
verdadera.

T.1.9. Indique cuál es la opción verdadera.

(a) Todas las operaciones estadísticas son realizadas por el INE


(b) Los parámetros son las características poblacionales que deseamos
investigar
( c) Las fuentes de información primarias son aquellas que se refieren al sector
primario
( d) Todas las anteriores son falsas

Solución: La opción (b) .

Justificación: La opción (a) es falsa porque aparte del INE existen otros
organismos que llevan a cabo operaciones estadísticas. Así, la información
tributaria y los resultados de Comercio Exterior dependen del Ministerio de
Hacienda, las Estadísticas de la construcción del Ministerio de Fomento, etc. La
opción ( c) es falsa porque las fuentes primarias son las elaboradas
específicamente para la propia investigación. La opción (d) es falsa porque la
opción (b) es verdadera .
INTRODUCCIÓN 5

T.1.10. Indique cuál es la opción falsa.

(a) Las muestras deben ser representativas de la población


(b) Para la realización del catastro no son necesarias las investigaciones
censales
(c) Las muestras deben tener un tamaño suficientemente grande
(d) Muestra es cualquier subconjunto de individuos pertenecientes a una
población determinada

Solución: La opción (b).

Justificación: La opción (b) es falsa porque para la realización del catastro son
necesarias las investigaciones censales, debiendo disponerse de información
detallada de todos y cada uno de los individuos a fin de fijar la cuota
impositiva que le corresponda.

T.1 .11. Indique cuál es la opción falsa.

(a) La Intervención General de la Administración del Estado elabora las


cuentas donde se registra la actividad económica desarrollada por las
administraciones públicas
(b) En la Estadística Mercantil del Registro Mercantil Central se publican datos
estadísticos referidos a los actos societarios de constitución, extinción,
transformación, fusión, aumento y reducciones de capital
( c) La Encuesta de Coyuntura Laboral es elaborada por el INE
(d) El Instituto de Estudios Turísticos genera datos sobre las llegadas de
visitantes extranjeros a nuestro país

Solución: La opción ( c).

Justificación: La opción (c) es falsa porque la Encuesta de Coyuntura Laboral


es llevada a cabo por el antiguo Ministerio de Trabajo e Inmigración
(actualmente Ministerio de Empleo y Seguridad Social).

T.1.12. Indique cuál es la opción falsa.

(a) El INE es el encargado de realizar la Encuesta de Gasto Turístico y


Movimientos Turísticos de los Españoles
(b) Las Magnitudes Monetarias y Financieras y los Tipos de interés y Tipos de
cambio dependen del Banco de España
(c) La Balanza de Pagos es elaborada por el Banco de España
(d) El Instituto de Estudios Turísticos (IET), es el encargado de la Encuesta de
Gasto Turístico y Movimientos Turísticos de los Españoles
6 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Solución: La opción (a).

Justificación: La opción (a) es falsa porque en el actual marco de


competencias, el Instituto de Estudios Turísticos, es el encargado de la
Encuesta de Gasto Turíst ico y Movimientos Turísticos de los Españoles.

T.1.13. Indique cuál es la opción falsa.

(a) Las estadísticas de la construcción son llevadas a cabo por el Ministerio de


Fomento
(b) La Balanza de Pagos es elaborada por el Banco de España
(c) Las respuestas (a) y (b) son falsas
(d) La estadística sobre los resultados de Comercio Exterior depende de la
Agencia Tributaria, encuadrada en el Ministerio de Hacienda

Solución: La opción ( c).

Justificación: La opción (c) es fa lsa porque las opciones (a) y (b) son
verdaderas.

T.1.14. En relación con el DIRCE, indique la opción verdadera.

(a) El DIRCE es un directorio económico que el INE ha elaborado y que cubre


la producción agraria y pesquera
(b) El DIRCE es un directorio económico que el INE ha elaborado y en el que
las actividades de las Administraciones Públicas (sanidad, enseñanza,
producción destinada a venta), y de las Instituciones Privadas sin fines de
lucro solo se cubren de forma parcial
(c) La unidad de referencia del DIRCE es la familia
(d) Ninguna de las opciones es verdadera

Solución: La opción (b ).

Justificación: La opción (a) es falsa porque el DIRCE no cubre la producción


agraria y pesquera . La opción (c) es fa lsa porque la unidad de referencia del
DIRCE es la empresa. La opción (d) es falsa porque la opción (b) es
verdadera .
INTRODUCCIÓN 7

T.1.15. Indique cuál es la opción falsa.

(a) La estadística de los tipos de interés es elaborada por el Ministerio de


Economía y Competitividad
(b) El Sistema de Cuentas Nacionales de la economía española está adaptado
al Sistema Europeo de Cuentas Nacionales y Regionales (SEC95), que
aplican de forma armonizada todos los Estados miembros de la Unión
Europea (UE)
(c) La responsabilidad de la elaboración de la Cuenta Satélite del Turismo de
España recae en la Subdirección General de Cuentas Nacionales del INE
(d) Las opciones (b) y (c) son verdaderas

Solución: La opción (a).

Justificación: La opción (a) es falsa porque la estadística de los tipos de interés


es elaborada por el Banco de España.

T.1.16. Indique cuál es la opción falsa.

(a) Toda la información sobre constituciones, cambios y cancelaciones


registrales de hipotecas se obtiene a partir de la información contenida en
los Registros de la Propiedad de todo el territorio nacional
(b) La Estadística Minera de España es elaborada por el INE
(c) El Ministerio de Industria, Turismo y Comercio (actualmente Ministerio de
Industria, Minería y Turismo) es el responsable de la elaboración de las
Estadísticas y Balances energéticos
(d) La fuente estadística básica para estudiar las operaciones de comercio
exterior es el Fichero Territorial de Aduanas, elaborado por el
Departamento de Informática Tributaria de la Agencia Estatal de
Administración Tributaria

Solución: La opción (b ).

Justificación: La opción (b) es falsa porque la Estadística Minera de España es


elaborada por el Ministerio de Industria, Turismo y Comercio ((actualmente
Ministerio de Industria, Minería y Turismo).
8 EJERCI CIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.1.17. Indique cuál es la opción falsa.

(a) A diferencia de la Encuesta Industrial de Empresas, la unidad de


información en la Encuesta Industrial de Productos es el establecimiento
industrial
(b) La Encuesta sobre la Estructura de la Construcción es elaborada por el
Ministerio de Fomento
(c) El Instituto de Estudios Turísticos es el encargado de las operaciones
estadísticas correspondientes a los Movimientos Turísticos en Fronteras, y
Movimientos Turísticos de los Españoles
(d) La Encuesta de Gasto Turístico es llevada a cabo por el INE sin
colaboración del Instituto de Estudios Turísticos

Solució n: La opción (d).

Justificación: La opción (d) es falsa porque la Encuesta de Gasto Turístico, en


el actual estado de competencias, es llevada a cabo por el Instituto de
Estudios Turísticos con la colaboración del INE y del Banco de España.

T.1.18. Indique cuál es la opción verdadera.

(a) La Encuesta de Gasto Turístico en España tiene como objetivo medir el


gasto realizado por los visitantes no residentes en España durante sus
viajes a España, pero no mide el gasto efectuado por los residentes
españoles durante sus viajes al extranjero
(b) La Encuesta de los Movimientos Turísticos de los Españoles es elaborada
por el INE y tiene como objetivo la estimación del número y características
de los viajes realizados por la población residente en España
(c) La Encuesta de los Movimientos Turísticos de los Españoles cuantifica los
flujos de viajeros españoles entre las distintas Comunidades Autónomas
pero no cuantifica los flujos desde España hacia el extranjero
(d) Ninguna de las respuestas es verdadera

Solución: La opción (d).

Justificación: La opción (a) es falsa porque la Encuesta de Gasto Turístico en


España tiene como objetivo med ir el gasto realizado por los visitantes no
residentes en España durante sus viajes, así como el gasto efectuado por los
residentes españoles durante sus viajes al extranjero. La opción (b) es falsa
porque la Encuesta de los Movimientos Turísticos de los Españoles es
elaborada por el Instituto de Estudios Turísticos con la colaboración del INE y
del Banco de España . La opción (c) es falsa porque la Encuesta de los
Movimientos Turísticos de los Españoles t iene como objetivo la estimación del
número y características de los viajes rea lizados por la población residente en
INTRODUCCIÓN 9

España, y cuantifica los flujos de v1aJeros españoles entre las distintas


Comunidades Autónomas y desde España hacia el extranjero.

T.1.19. Indique cuál es la opción falsa.

(a) La Intervención General de la Administración del Estado (IGAE) también


suministra información sobre las liquidaciones presupuestarias de cada uno
de los organismos de las Comunidades Autónomas y de las Corporaciones
Locales
(b) La Estadística del Gasto Público en Educación es elaborada por el
Ministerio de Educación (actualmente Ministerio de Educación, Cultura y
Deporte)
( c) La Cuenta Satélite del Gasto Sanitario es elaborada por el INE
(d) Las respuestas (a) y (b) son verdaderas

Solución: La opción (c).

Justificación: La opción (e) es falsa porque la Cuenta Satélite del Gasto


Sanitario es elaborada por el Ministerio de Sanidad y Política Social
(actualmente Ministerio de Sanidad, Servicios Sociales e Igualdad)

T.1.20. Indique cuál es la opción verdadera.

(a) La Encuesta de Presupuestos Familiares suministra información anual


sobre la naturaleza y destino de los gastos de consumo, así como sobre los
impuestos que pagan las familias y empresas españolas
(b) La Encuesta de Presupuestos Familiares suministra información sobre
ca racterísticas relativas a las condiciones de vida de los hogares
(c) El Índice de Precios de Consumo (IPC) mide la evolución mensual del nivel
de precios de los bienes y servicios de consumo adquiridos por los turistas
extranjeros
(d) El Índice de Precios de Consumo (IPC) es un índice de tipo Paasche

Solución: La opción (b).

Justificación: La opción (a) es falsa porque la Encuesta de Presupuestos


Familiares suministra información anual sobre la naturaleza y destino de los
gastos de consumo, así como sobre diversas características relativas a las
condiciones de vida de los hogares pero no sobre los impuestos que pagan las
familias españolas . La opción (c) es falsa porque el Índice de Precios de
Consumo (IPC) mide la evolución mensual del nivel de precios de los bienes y
servicios de consumo adquiridos por los hogares residentes en España . La
opción (d) es falsa porque el Índice de Precios de Consumo (IPC) es un índice
de tipo Laspeyres.
10 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.1.21. Indique cuál es la opción falsa.

(a) La precisión con la que el Índice de Precios al Consumo (IPC) mide la


evolución del nivel de precios depende de dos cualidades:
representatividad y comparabilidad temporal
(b) Una aplicación del Índice de Precios al Consumo es su utilización como
medida de la inflación
(c) Una aplicación del Índice de Precios al Consumo es su utilización como
medida del déficit público
(d) Una aplicación del Índice de Precios al Consumo es su utilización en la
revisión de los contratos de arrendamiento de inmuebles

Solución: La opción (c).

Justificación: La opción ( c) es falsa porque la medida del déficit público no es


una aplicación del Índice de Precios al Consumo.

T.1.22. Indique cuál es la opción falsa.

(a) La fuente de información utilizada para el cálculo del Índice de Precios de


Vivienda procede de las bases de datos sobre viviendas escrituradas que
proporciona el Consejo General del Notariado
(b) Los Índices de Precios Percibidos y Pagados por los Agricultores miden la
evolución de los precios que percibe el agricultor y el ganadero por la
venta de los productos agrarios
(c) Los Índices de Precios Percibidos y Pagados por los Agricultores son
elaborados por el INE
(d) Las respuesta (a) y (b) son verdaderas

Solución: La opción (c).

Justificación: La opción ( c) es falsa porque los Índices de Precios Percibidos y


Pagados por los Agricultores, que miden la evolución de los precios que
percibe el agricultor y el ganadero por la venta de los productos agrarios y la
de los precios que se pagan por las compras de materiales y
aprovisionamientos, son elaborados por el Ministerio de Medio Ambiente y
Medio Rural y Marino (actualmente Ministerio de Agricultura, Alimentación y
Medio Ambiente)
INTRODUCCIÓN 11

T.1.23. Indique cuál es la opción verdadera.

(a) El Índice de Precios Industriales es elaborado por el Ministerio de Industria


(b) El Índice de Precios Industriales mide la evolución mensual de los precios
de los productos industriales importados
(c) Los Índices de Precios de Materiales del Sector de la Construcción son
elaborados por el INE
(d) Los Índices de Precios de Materiales del Sector de la Construcción son
elaborados por el Ministerio de Fomento y se utilizan para las cláusulas de
revisión de precios que figuran en los contratos de las Administraciones
públicas

Solución: La opción (d).

Justificación: La opción (a) es falsa porque el Índice de Precios Industriales es


elaborado por el INE. La opción (b) es falsa porque el Índice de Precios
Industriales es un indicador coyuntural que mide la evolución mensual de los
precios de los productos industriales fabricados y vendidos en el mercado
interior. La opción ( c) es falsa porque los Índices de Precios de Materiales del
Sector de la Construcción, son elaborados por el Ministerio de Fomento.

T.1.24. Indique cuál es la opción falsa.

(a) El Instituto Nacional de Empleo publica mensualmente estadísticas sobre el


paro registrado con desagregación de datos a nivel provincial de edad y
sexo de los demandantes de empleo y sectores económicos
(b) El Instituto Nacional de Empleo (INEM) no publica información sobre
contrataciones por modalidades (indefinidos y temporales)
( c) La Encuesta de Población Activa es una encuesta elaborada por el INE
(d) La Encuesta de Coyuntura Laboral es una investigación por muestreo
realizada por el Ministerio de Trabajo (actualmente Ministerio de Empleo y
Seguridad Social)

Solución: La opción (b ).

Justificación: La opción (a) es falsa porque el Instituto Nacional de Empleo


(IN EM ) suministra información sobre contrataciones por modalidades
(indefinidos y temporales).

T.1.25. Entre las opciones siguientes, indique cuál es la operación


estadística que debería elegir para realizar un estudio sobre la
evolución de los precios de los tomates en los supermercados
españoles.
12 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

(a) El Índice de Precios Industriales


(b) El Índice de Precios Percibidos y Pagados por los Agricultores
(c) El Índice de Precios al Consumo
( d) Los Índices de Precios del Sector Servicios

Solución: La opción (c).

Justificación: La opción (a) es falsa porque el Índice de Precios Industriales


mide la evolución mensual de los precios de los productos industriales
fabricados y vendidos en el mercado interior, en el primer paso de su
comercia lización, es decir, de los precios de venta a salida de fábrica
obtenidos por los establecimientos industriales en las transacciones que estos
efectúan, excluyendo los gastos de transporte y comercialización y el IVA
facturado. La opción (b) es falsa porque los Índices de Precios Percibidos y
Pagados por los Ag ricultores miden la evolución de los precios que percibe el
agricultor y el ganadero por la venta de los productos agrarios y la de los
precios que se pagan por las compras de materiales y aprovisionamientos y
nada tiene que ver con el precio de venta en los supermercados. La opción (d)
es falsa porque los Índices de Precios del Sector Servicios miden la evolución
de los precios, desde el lado de la oferta, de las actividades de las empresas
que operan en los sectores de Transporte Marítimo de Mercancías, Transporte
Aéreo Regular de Pasajeros, Manipulación de mercancías, Depósito y
almacenamiento, Actividades Postales y de Correos, Telecomunicaciones,
Programación y Consultoría Informática, Servicios de información, Asesoría
Jurídica y Económica, Servicios y análisis técnicos, Publicidad y Estudios de
Mercado, Actividades relacionadas con el empleo, Actividades de Seguridad y
Actividades de Li mpieza.

T.1.26. Indique cuál de las siguientes afirmaciones es falsa.

(a) El Índice de Precios I ndustriales (IPRI) es elaborado por el INE


(b) El Índice de Precios de Consumo (IPC) también sirve para conocer la
evolución mensual del nivel de precios de la vivienda
(c) La fuente de información utilizada para el cálculo del Índice de Precios de
Vivienda procede de las bases de datos sobre viviendas escrituradas que
proporciona el Consejo General del Notariado
(d) Las opciones (a) y (c) son verdaderas

Solución: La opción (b ).

Justificación: La opción (b) es fa lsa porque el Índice de Precios de Consumo


(IPC) no sirve para conocer la evolución mensual del nivel de precios de la
vivienda.
INTRODUCCIÓN 13

T.1.27. Indique cuál de las siguientes opciones es verdadera.

(a) El Índice de Precios Industriales es elaborado por el Ministerio de


Industria, Energía y Turismo
(b) El DIRCE es un organismo público dependiente del Ministerio de Economía
y Competitividad que elabora la Encuesta Industrial de Empresas
(c) La Agencia Estatal de Administración Tributaria elabora la estadística
básica sobre el comercio exterior en España
(d) Ninguna de las respuestas anteriores es correcta

Solución: La opción (c) .

Justificae16n: La opción (a) es falsa porque el Índice de Precios I ndustriales es


elaborado por el INE. La opción (b) es falsa porque el DIRCE es un directorio
económico que el INE ha elaborado y cubre todas las actividades económicas
excepto la producción agraria y pesquera, los servicios administrativos de la
Administración Central, Autónoma y Local (incluida la Seguridad Social), las
actividades de las comunidades de propietarios y el servicio doméstico. El
resto de las actividades de las Administraciones Públicas (sanidad, enseñanza,
producción destina a venta), y de las Instituciones Privadas sin fines de lucro
solo se cubren de forma parcial. La opción (d) es falsa porque la opción (c) es
verdadera.

T.1.28. En relación con el Índice de Precios Industriales, indique cuál


de las siguientes opciones es verdadera.

(a) Mide la variación de los precios de los bienes de consumo


(b) Tiene periodicidad mensual
(c) Es elaborado por el Banco de España
(d) Es elaborado por el Ministerio de Fomento

Solue16n: La opción (b).

Justificación: La opción (a) es falsa porque el Índice de Precios Industriales


mide la evolución mensual de los precios de los productos industriales
fabricados y vendidos en el mercado interior, en el primer paso de su
comercialización, es decir, de los precios de venta a salida de fábrica
obtenidos por los establecimientos industriales en las transacciones que estos
efectúan, excluyendo los gastos de transporte y comercialización y el IVA
facturado. Las opciones (c) y (d) son falsas porque el Índice de Precios
Industriales es elaborado por el INE.
14 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.1.29. Indique cuál de las siguientes opciones es falsa.

(a) El DIRCE es un organismo público dependiente del Ministerio de Economía


y Competitividad que elabora la Encuesta Industrial de Productos
(b) La Agencia Estatal de Administración Tributaria elabora la estadística
básica sobre el comercio exterior en España
(c) El Índice de Precios Industriales es elaborado por el INE
(d) La Encuesta sobre la Estructura de la Construcción es elaborada por el
Ministerio de Fomento

Solución: La opción (a).

Justificación: La opción (a) es falsa porque el DIRCE es un directorio


económico que el INE ha elaborado y cubre todas las actividades económicas
excepto la producción agraria y pesquera, los servicios administrativos de la
Administración Central, Autónoma y Local (inclu ida la Seguridad Social), las
actividades de las comunidades de propietarios y el servicio doméstico. El
resto de las actividades de las Administraciones Públicas (sanidad, enseñanza,
producción destina a venta), y de las Instituciones Privadas sin fines de lucro
solo se cubren de forma parcial.

T.1.30. En relación con el IPC (Índice de precios al consumo), indique


la opción verdadera.

(a) En su cálculo intervienen todos los bienes y servicios que existen en el


mercado
(b) Es un índice de precios del tipo Laspeyres
(c) En el IPC se incluyen los precios de los productos industriales
(d) Las respuestas (b) y (c) son correctas

Solución: La opción (b).

Justificación: La opción (a) es falsa porque en el cá lculo del IPC no intervienen


todos los bienes y servicios que existen en el mercado. La opción (c) es falsa
porque en el IPC no se incluyen los precios de los productos industriales. La
opción (d) es falsa porque la opción (c) es falsa.
INTRODUCCIÓN 15

T.1.31 . En relación con el cálculo del IPC (Índice de precios al


consumo}, indique cuál es la opción verdadera.

(a) Intervienen todos los bienes y servicios que existen en el mercado


(b) Con el sistema IPC Base 2001, se incluyen los precios rebajados de los
bienes y servicios
(c) Las respuestas (a) y (b) son correctas
(d) Ninguna de las respuestas es correcta

Solución: La opción (b) .

Justificación: La opción (a) es falsa porque en el cálculo del IPC no intervienen


todos los bienes y servicios que existen en el mercado sino solo los bienes y
servicios de consumo adquiridos por los hogares residentes en España. La
opción (c) es falsa porque la respuesta (a) es falsa. La opción (d) es falsa
porque la respuesta ( b) es verdadera.

T.1.32. En relación con el deflactor que puede utilizarse en la


Contabilidad Nacional, indique cuál es la opción verdadera.

(a) Índice de producción industria l


(b) Índices de Precios Percibidos y Pagados por los Agricultores
(c) Índice de Precios al Consumo
(d) Ninguna de las anteriores es verdadera

Solución: La opción (c).

Justificación: La opción (a) es falsa porque el índice de producción industrial


no es un índice de precios y por tanto no puede utilizarse como deflactor. La
opción (b) es falsa porque los Índices de Precios Percibidos y Pagados por los
Agricultores solo miden la evolución de los precios que percibe el agricultor y
el ganadero por la venta de los productos agrarios y la de los precios que se
pagan por las compras de materiales y aprovisionamientos. La opción (d) es
falsa porque la opción (c) es verdadera.

El deflactor de las macromagnitudes de la Contabilidad Nacional, en particular


el deflactor del PIB es un índice que permita pasar la serie de PIB en términos
nominales a una serie del PIB en términos reales; para ello debe utilizarse un
índice de precios que recoja la variación que se ha producido en el nivel de
precios del país de referencia durante un periodo determinado, es decir, en el
caso de España, el IPC.
16 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.1.33. Entre las opciones siguientes, indique cuál es la operación


estadística que debería elegir para realizar un estudio sobre la
evolución del gasto en consumo de los hogares españoles.

(a) Encuesta de Gasto Turístico en España


(b) Encuesta de Presupuestos Familiares
(c) Encuesta de Población Activa
(d) Ninguna de las opciones es verdadera

Solución: La opción (b ).

Justificación: La opción (a) es falsa porque la Encuesta de Gasto Turístico en


España tiene como objetivo medir tanto el gasto realizado por los visitantes no
residentes en España durante sus viajes a España, así como el gasto
efectuado por los residentes españoles durante sus viajes al extranjero. La
opción (b) es verdadera porque la Encuesta de Presupuestos Familiares
proporciona estimaciones del gasto de consumo anual para el conjunto
nacional y las comunidades autónomas y del consumo en cantidades físicas de
determinados bienes alimenticios para el conjunto nacional. La opción (c) es
falsa porque la Encuesta de Población Activa suministra información sobre la
situación laboral, clasificada en Activos, I nactivos, Ocupados o Parados. La
opción (d) es falsa porque la opción (b) es verdadera.

T.1.34. Indique cuál de las siguientes opciones es verdadera.

(a) El DIRCE cubre la producción agraria y pesquera


(b) La Balanza de Pagos española es elaborada por el INE
(c) La responsabilidad de la elaboración de la Cuenta Satélite del Turismo de
España recae en el Instituto de Estudios Turísticos.
(d) Todas las respuestas son falsas

Solución: La opción (d).

Justificación: La opción (a) es falsa porque el DIRCE es un directorio


económico que el INE ha elaborado y cubre todas las actividades económicas
excepto la producción agraria y pesq uera, los servicios ad ministrativos de la
Administración Central, Autónoma y Local (incluida la Seguridad Social), las
actividades de las comunidades de propietarios y el servicio doméstico. El
resto de las actividades de las Administraciones Públicas (sa nidad, enseñanza,
producción destina a venta), y de las Instituciones Privadas sin fines de lucro
solo se cubren de forma parcial. La opción (b) es falsa porque la Balanza de
Pagos española es elaborada por el Banco de España. La opción (c) es falsa
porque la responsabilidad de la elaboración de la Cuenta Satélite del Turismo
de España recae en la Subdirección General de Cuentas Nacionales del INE.
INTRODUCCIÓN 17

T.1.35. Indique cuál de las siguientes opciones es falsa.

(a) Un objetivo de la Encuesta de Los Movimientos Turísticos de los Españoles


es cuantificar los flujos de viajeros españoles desde España hacia el
extranjero
(b) La Encuesta de Presupuestos Familiares suministra información también
sobre diversas características relativas a las condiciones de vida de los
ho9ares
( c) El Indice de Precios de Consumo (IPC) mide la evolución mensual del nivel
de precios de los bienes y servicios de consumo adquiridos por los hogares
residentes en España y es un índice de tipo Laspeyres
(d) Todas las respuestas son falsas

Solución: La opción (d).

Justificación: La opción ( d) es falsa ya que todas las respuestas son


verdaderas.

T.1.36. La Encuesta Anual de Servicios de España.

(a) Es una Encuesta que realiza el INE a las empresas encuadradas en los
diversos subsectores del sector de servicios; tiene carácter trimestral y
permite fundamentalmente estimar el empleo y el desempleo en cada
sector de actividad de la economía española
(b) Es una Encuesta que realiza el INE a las empresas encuadradas en los
diversos subsectores del sector de servicios; tiene periodicidad anual y
permite estimar las variables macroeconómicas del sector y su
contribución al PIB y a la contabilidad nacional a partir de la información
que suministran las empresas del sector servicios de España
( c) Es una Encuesta elaborada con periodicidad por el Ministerio de Economía
y Competitividad y que tiene por fin conocer la estructura del sector para
decidir las políticas a seguir en relación con la mejora del mismo
(d) Ninguna de las opciones es correcta

Solución: La opción (b ).

Justificación: La opción (a) es falsa porque la Encuesta Anual de Servicios de


España tiene carácter anual y permite estimar las variables macroeconómicas
del sector y su contribución al PIB y a la contabilidad nacional. La opción (c)
es falsa porque la Encuesta Anual de Servicios de España es elaborada por el
INE. La opción (d) es falsa porque la opción (b) es verdadera .
18 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.1.37. Indique cuál de las siguientes opciones es falsa.

(a) La Encuesta Industrial de Productos tiene como objetivo ofrecer detalle de


la producción comercializada por la industria en España y la unidad de
información es el establecimiento industrial
(b) La Encuesta de Servicios es elaborada por el INE
( c) La Encuesta de Gasto Turístico en España mide el gasto efectuado por los
residentes españoles durante sus viajes al extranjero.
(d) Ninguna de las otras respuestas es verdadera.

Solución: La opción (d).

Justificación: La opción (d) ya que todas las respuestas son verdaderas.

T.1.38. En relación con las fuentes de información estadística sobre


empleo elaboradas por el Ministerio de Trabajo e Inmigración
(actualmente Ministerio de Empleo y Seguridad Social ), indique cuál
de las opciones siguientes es falsa.

(a) Encuesta de Población Activa y Encuesta de Coyuntura Laboral


(b) Encuesta de Coyuntura Laboral y Estadística de Paro y Contratos
Registrados
(c) Encuesta de Coyuntura Laboral y Afiliación de trabajadores a la Seguridad
Social
(d) Las opciones (b) y (c) son verdaderas

Solución: La opción (a).

Justificación: La opción (a) no es correcta porque el INE elabora la Encuesta


de Población Activa.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 19

CAPÍTULO 2. DISTRIBUCIONES DE FRECUENCIAS


UNIDIMENSIONALES

2.1. Preguntas Teóricas

T.2.1. Indique la solución falsa en relación con que las distribuciones


de frecuencias pueden ser:

(a) Unidimensionales
(b) Bidimensionales
(c) Multidimensionales
(d) Ninguna de las opciones es verdadera

Solución: La opción correcta es la (d).

Justificac16n: La opción (d) es falsa porque las distribuciones de frecuencias


pueden ser Unidimensionales, Bidimensionales y Multidimensionales.

T.2.2. La relación por cociente entre la frecuencia absoluta de un


valor y el número total de observaciones o datos recibe el nombre
de:

(a) Frecuencia relativa


(b) Frecuencia acumulada
( c) Frecuencia absoluta
(d) Ninguna solución es correcta.

Soluc16n: La opción (a).

Justificac16n: Las opciones (b) y (c) son fa lsas porque por definición el
cociente entre la frecuencia absoluta de un valor y el número total de
observaciones o datos recibe el nombre de frecuencia relativa. La opción (d)
es falsa porque la opción (a) es verdadera .

T.2.3. En una distribución de frecuencias unidimensionales, se puede


afirmar que:

(a) La suma de frecuencias relativas es siempre 1


(b) La frecuencia absoluta es siempre menor a la frecuencia relativa
(c) La frecuencia absoluta acumulada suma 1
(d) Ninguna de las anteriores es cierta

Solución: La opción (a).


20 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Justificación: Las opciones (b) y ( c) son falsas porque por definición la suma
de frecuencias relativas es siem pre 1. La opción (d) es falsa porque la opción
(a) es verdadera.

T.2.4. La suma de las frecuencias relativas de una distribución den =


6 es igual a:

(a) 1
(b) 6
( c) Ninguna de las otras soluciones es correcta
(d) o
Solución: La opción (a).

Justificación: Las opciones (b) y (d) son falsas porque por definición la suma
de frecuencias relativas es siem pre 1. La opción (c) es falsa porque la opción
(a) es verdadera .

T.2.5. En una distribución de frecuencias, el número de veces que se


presenta un valor (sí se trata de una variable) o un carácter o
modalidad (sí se trata de un atributo) se conoce con el nombre de:

(a) Frecuencia absoluta


(b) Frecuencia relativa
(c) Frecuencia acumulada
(d) Frecuencia total

Soluo6n: La opción (a).

Justificación: Las opciones (b), (c) y (d) son falsas porque, por definición, el
número de veces que se presenta un valor (sí se trata de una variable) o un
carácter o modalidad (sí se trata de un atributo) se conoce con el nombre de
Frecuencia absoluta.

T.2.6. ¿cuándo se elabora una distribución de frecuencias de Tipo 1 o


distribución unitarias?

(a) Cuando cada valor de la característica medida se repite un determinado


número de veces
(b) Cuando los valores de la variable no se repiten.
(c) Ninguna de las soluciones es correcta.
(d) Al trabajar con variables continuas o con variables discretas que presentan
una gran cantidad de valores
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 21

Solución: La opción (b).

Justificación: Las opciones (a), (c) y (d) son falsas porque, por definición, las
distribuciones de frecuencias de tipo 1 son aquellas en las que los valores de la
variable no se repiten.

T.2.7. Una distribución en la que cada valor de la característica


medida se repite un determinado número de veces se denomina:

(a) Distribución de Tipo 1


(b) Distribución Unitarias
(c) Distribuciones de Tipo II.
(d) Distribuciones de Tipo III.

Solución: La opción (c).

Justificación: Las opciones (a), (b) y (d) son falsas porque, por definición, las
distribuciones de frecuencias de tipo 11 son aquellas en las que cada valor de
la característica medida se repite un determinado número de veces.

T.2.8. El intervalo (8,10], se define como:

(a) Abierto por ambos extremos


(b) Cerrado por ambos extremos
(c) Abierto por el extremo inferior y cerrado por el extremo superior
(d) Cerrado por el extremo inferior y abierto por el extremo superior

Solución: La opción (c).

Justificación: Las opciones (a), (b) y ( d) son falsas porque el intervalo (8, 10),
se define como abierto por el extremo inferior y cerrado por el extremo
superior.

T.2.9. En una distribución de frecuencias unidimensional con datos


agrupados en intervalos, se puede afirmar que:

(a) La amplitud del intervalo se calcula como la diferencia entre los dos
extremos del intervalo
(b) La marca de clase coincide con el límite superior del intervalo
( c) La amplitud de los intervalos siempre es la misma
(d) Un dato puede estar contenido en dos intervalos distintos

Solución: La opción (a).


22 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Justificación: La opción (b) es falsa porque la marca de clase coincide con el


punto medio del intervalo. La opción (c) es falsa porque la amplitud de los
intervalos puede ser diferente en cada uno de ellos. La opción (d) es falsa
porque un dato solo puede estar contenido en un intervalo.

T.2.10. Indique la solución correcta.

(a) Los gráficos de barras se emplean para representar variables discretas en


distribuciones de frecuencias de datos agrupados
(b) El histograma es una representación gráfica compuesta por un conjunto de
rectángulos donde cada uno representa una clase, la base de los
rectángulos sería igual a dos veces la amplitud del intervalo y la altura se
determina de forma que el área del rectángulo sea proporcional a la
frecuencia de cada clase.
(c) Nunca deben utilizarse los polígonos de frecuencia para representar tablas
de frecuencia asociadas a distribuciones de datos cuantitativos de tipo II
(d) Ninguna de las anteriores es correcta

Solución: La opción (d).

Justificación: La opción (a) es falsa porque, en general, los gráficos de barras


se emplean para variables discretas en distribuciones de frecuencias con datos
sin agrupar. La opción (b) es falsa porque un histograma es una
representación gráfica compuesta por un conjunto de rectángulos donde cada
uno representa una clase, la base de los rectángulos sería igual a la amplitud
del intervalo y la altura se determina de forma que el área del rectángu lo sea
proporcional a la frecuencia de cada clase. La opción (c) es falsa porque los
polígonos de frecuencia suelen utilizarse para representar tablas de frecuencia
asociadas a distribuciones de datos cuantitativos de tipo II, si bien pueden
utilizarse con cualquier tipo de datos. En el caso de las distribuciones de tipo
III, los puntos en el eje de abscisas corresponderán a las marcas de clase de
los intervalos.

T.2.11. Indique la solución correcta.

(a) Los puntos del eje de abscisas en los polígonos de frecuencias


corresponden al límite superior del intervalo
(b) En los gráficos de sectores el área de cada sector es proporcional a las
frecuencias absolutas acumuladas de cada modalidad
( c) En los diagramas de tallos y hojas se representan los valores ordenados
según la secuencia temporal, la cual figura en el eje de abscisas, en tanto
que los valores obtenidos se representan en el eje de ordenadas
(d) Ninguna de las anteriores es correcta
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 23

Solución: La opción (d).

Justificación: La opción (a) es falsa porq ue los puntos del eje de abscisas en
los polígonos de frecuencias corresponden a las marcas de clase de los
intervalos. La opción (b) es falsa porque en los gráficos de sectores el área de
cada sector es proporcional a las frecuencias absolutas de cada modalidad. La
opción (c) es falsa porque en los diagramas de tallos y hojas comenzamos
seleccionando los tallos; a continuación efectuamos un recuento y vamos
«añadiendo» cada hoja a su tallo; y por último reordena mos las hojas,
terminando así el diagrama.

T.2.12. En un histograma:

(a) Las alturas de los rectángulos representan las frecuencias absolutas


(b) Las alturas de los rectángulos se calculan de ta l forma que el área del
rectángu lo sea proporcional a la frecuencia de cada clase
(c) Las alturas de los rectángu los representan las frecuencias relativas
(d) Ninguna de las demás soluciones es verdadera

Solución: La opción (b).

Justificao6n: Las opciones (a) y (c) son falsas porque en un histograma, las
alturas de los rectángulos se calculan de tal forma que el área del rectángulo
sea proporcional a la frecuencia de cada clase . La opción (d) es falsa porque la
opción (b) es verdadera.

T.2.13. Indique la opción verdadera.

(a) El objetivo de los Diagramas de Pareto es permitir visualizar de forma


rápida los problemas o los datos más significativos, que quedan a la
derecha de la gráfica
(b) La marca de cada clase se obtiene como la mitad de la frecuencia absoluta
de la clase
(c) En los histogramas la representación es un conjunto de rectángulos donde
cada uno representa una clase; la base de los rectángulos es igual a la
frecuencia de cada clase
(d) Todas las soluciones son falsas

Solución: La opción (d).

Justificación: La opción (a) es falsa porque el objetivo de los Diagramas de


Pareto es permitir visualizar de forma rápida los problemas o los datos más
sig nificativos, que quedan a la izquierda de la gráfica, mientras que a medida
que se avanza hacia la derecha del gráfico se van situando los datos de menor
24 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

interés. La opción (b) es falsa porque la marca de cada clase se obtiene como
el punto medio de cada intervalo. La opción ( c) es falsa porque en los
histogramas, la representación es un conjunto de rectángulos donde cada uno
representa una clase; la base de los rectángulos es igual a la amplitud del
intervalo y la altura se determina de forma que el área del rectángulo sea
proporcional a la frecuencia de cada clase.

T.2.14. Dados unos datos correspondientes a los distintos tipos de


contrato en un país, indique cuál de los siguientes gráficos no sería
adecuado.

(a) El histograma
(b) El pictograma
(c) Diagrama de sectores
(d) Gráfico de barras

Solución: La opción (a).

Justificación: La opción (a) es falsa porque el histograma está recomendado


para variables agrupadas por intervalos.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 25

2.2. Problemas

P.2.1. Una empresa t iene un total de 20 empleados que trabajan en


cuatro oficinas. Las oficinas están numeradas del 1 al 4. Los registros
de la empresa que se muestran a continuación, indican las oficinas
en las que se ubican los 20 vendedores listados en orden alfabético
{1ª línea de la tabla: empleado; 2ª línea: oficinas}. Indique la opción
correcta.

Empleado 1 2 3 4 5 6 7 8 9 10
Oficinas 1 4 1 3 3 2 1 1 1 3

Empleado 11 12 13 14 15 16 17 18 19 20
Oficinas 4 4 2 2 1 1 2 4 4 1

(a) La frecuencia relativa correspondiente al número de empleados que


trabajan en la tercera oficina es 0,15
( b) La segunda oficina es en la que menos empleados trabajan
(c) La frecuencia relativa de trabajadores de la tercera oficina es 0,8
(d) La mitad de los empleados trabajan en la primera oficina

Solución: La opción (a).

Justificación: Como se demuestra a continuación, la opción (b) es falsa porque


la oficina en la que menos empleados trabajan es la tercera. La opción (c) es
falsa porque la frecuencia relativa de trabajadores de la tercera oficina es
0,15. La opción (d) es falsa porque en la primera oficina trabajan 8 empleados
que son menos de la mitad de los empleados ( 10).

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La manera más sencilla de obtener las frecuencias es enumerar los números


de las oficinas y contar las respectivas frecuencias en cada una; por ejemplo,
en la oficina 1 se cuentan 8 empleados ( los enumerados en las posiciones 1,
3, 7, 8, 9 15, 16 y 20).

Resulta, por tanto, la siguiente tabla:

Número de la oficina (x¡) 1 2 3 4


Frecuencia absoluta (número de
8 4 3 5
empleados) (n¡)
Frecuencia acumulada ( N¡) 8 12 15 20
26 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Para obtener las frecuencias relativas deben dividirse las frecuencias absolutas
por el número total de observaciones. La información demandada sería, por
tanto, la siguiente:

Número de oficina ( X¡) 1 2 3 4

Frecuencia relativa (f¡)


Yio=0.40 0,20 0,15 0,25

Frecuencia relativa acumulada (F) 0,40 0,60 0,75 1

Para convertir las frecuencias relativas en porcentajes, habría simplemente


que multiplicarlas por 100; obteniéndose 40 %, 20 %, 15 % y 25 %.

P.2.2. A partir de los salarios mensuales de los empleados de una


empresa que se muestran a continuación, se construyen cinco
intervalos de igual amplitud (500) que abarcan valores de salarios
desde 250 euros hasta 2750 euros. Indique cuál es la opción
verdadera.

850 1265 895 575 2410 470 660 1820 1510 1100
620 425 751 965 840 1505 1375 695 1125 1475

(a) La frecuencia relativa del segundo intervalo es 0,35


(b) La marca de clase del tercer intervalo es l. 750 euros
(c) Hay un total de 15 empleados
(d) Hay ocho empleados que cobran menos de 1.000 euros

Solución: La opción (a).

Justificación: Como se demuestra a continuación, la opción (b) es falsa porque


la marca de clase del tercer intervalo es 1.500. La opción (c) es falsa porque
hay un total de 20 empleados. La opción (d) es falsa porque hay once
empleados que cobran menos de 1.000 euros.

Cálculo: A continuación se describe el proceso de cálculo adoptado.

Se construye la siguiente tabla de frecuencias con intervalos.


DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 27

Intervalo de Frecuencia Frecuencia Frecuencia


Frecuencia
Clase absol uta acumulada relativa
(n;) (N¡) relativa(f;)
( L;-1- L;l acumulada (F¡)
250 - 750 6 6 0,30 0,30
751 - 1250 7 13 0,35 0,65
1251 - 1750 5 18 o 25 0,90
1751 - 2250 1 19 0,05 0,95
2251 - 2750 1 20 0,05 1

Solución:

Nótese que en la construcción de la tabla de frecuencias:


• Cada observación cae exactamente dentro y sólo dentro de una clase o
intervalo; a tal fin se han construido los intervalos abiertos por la
izquierda (extremo inferior) y cerrados por la derecha (extremo
superior), de forma que, por ejemplo, el empleado que gana 750 € al
mes ha quedado incluido en el primer intervalo (250- 750].
• No hay espacios entre los intervalos, de forma que todo el rango o
recorrido de los datos está incluido en los extremos de las clases.
• Todas las clases tienen la misma amplitud (500 euros).
Las marcas de clase de los intervalos x, = L,.,; L, serían, redondeando: 500,
1000, 1500, 2000 y 2500.

P.2.3. Se representan mediante el diagrama adjunt o de tallos y hojas


las calificaciones (con 100 puntos de calificación máxima} de 40
aspirantes a un empleo en una prueba de aptitud . Indique la opción
correcta.

2 1 9
3 4 7
4 2 6 7 6
5 9 7 5
6 9 4 o 9 5 9 9 8 6
7 7 5 3 4 o 4 5
8 7 1 7 1 2 6 7 1 2
9 7 1 o 4

(a) La mayor calificación obtenida es 94 puntos


(b) La calificación más repetida es 87 puntos
(c) Hay cinco individuos que han obtenido una calificación de 6 puntos
(d) Ninguna de las opciones anteriores es correcta
28 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es fa lsa porque


la mayor calificación obtenida es 97 puntos. La opción (b) es falsa porque la
calificación más repetida es 69 puntos que se repte cuatro veces. La opción
(c) es falsa porque ningún individuo ha obtenido la puntuación de 6.

Cálculo: A conti nuación se describe el proceso de cálculo adoptado.

En los diagramas de tallos y hojas, el número de la columna de la izquierda


corresponde con las decenas y el de la derecha corresponde a las unidades.
De esta forma, las calificaciones obtenidas corresponden a los números
sigu ientes:

21 29 34 37 42 46 47 46 59 57
55 69 64 60 69 65 69 69 68 66
77 75 73 74 70 74 75 87 81 87
81 82 86 87 81 82 97 91 90 94

A parti r de los datos anteriores se concluye que la mayor ca lificación obtenida


es 97 puntos y el número más frecuente es 69, así como que ningún individuo
ha obtenido la puntuación de 6.

P.2.4 . Se lanza al aire un dado 20 veces y se obtienen los resultados


que se muestran a continuación. Indique cuál es el valor del número
de datos disponibles.

Número obtenido 1 2 3 4 5 6
Nº de veces que aparece dicho número 2 3 5 5 1 4

(a) 5 por ser el máximo


(b) 20 por ser el número de veces que se lanza el dado
(c) 7,2 por ser la media aritmética
(d) Ninguna de las anteriores es cierta

Solución: La opción (b).

Justificación: Como se demuestra a continuación, las opciones (a) y (c) son


falsas porque el valor del número de datos disponibles es el número de
unidades en las cuales se efectúa la medición. Por lo tanto, en este ejercicio,
consistente en tirar el dado un total de 20 veces, la N, o número de datos
disponibles, toma el valor de 20. La opción (d) es falsa porq ue la opción (b) es
verdadera.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 29

P.2.5. Se lanza al aire un dado 20 veces y se obtienen los resultados


que se muestran a continuación. Indique cuál es la opción verdadera.

3
Número obtenido 1 2 3 4 5 6
i
Nº de veces que aparece dicho número 2 3 5 5 1 4

(a) La media aritmética es 5


(b) El valor 4 es el que menos veces se repite
(c) La frecuencia relativa del valor 2 es 0,15
(d) Ninguna de las anteriores es cierta

Solución: La opción (c).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


la media aritmética es 3,6. La opción (b) es falsa porque el valor que menos
veces se repite es el S. La opción (d) es falsa porque la opción (c) es
verdadera .

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La expresión de la media aritmética es la siguiente:


/; 6

¿x n 1 1
X = x1n1+X2 n2+ X3n3+ .......+x6n6 = f;1 = 72 = 36
,
n1 + n1 + n3+ ....... + n6 N 20

A partir de la distribución de frecuencias asociada al experimento, se deduce


que el valor que menos veces se repite es el 5 que solo aparece una vez.

La frecuencia relativa se calcula como el cociente entre la frecuencia absoluta


con la que se presenta un valor o una modalidad y la frecuencia total de datos
(ni/N). En el ejemplo considerado, para el valor 2 toma el valor 0,15 ya que
3/ 20=0, 15.

P.2.6. En relación con la distribución de frecuencias siguiente,


indique la solución correcta.

( Li-1- L¡] n¡
20-30 14
30-40 4
40-50 9
50-60 3
30 EJERCIC IOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE

(a) La marca de clase del primer intervalo es 25


(b) La marca de clase del primer intervalo es 10
(c) La marca de clase coincide con el límite inferior del intervalo
(d) Ninguna de las opciones es correcta

Solución: La opción (a).

Justificación: Como se demuestra a continuación, la opción (b) es falsa porque


la marca de clase del pri mer intervalo es 25. La opción ( c) es falsa porque la
marca de clase no coincide con el límite inferior del intervalo sino que se
define como el punto medio de cada intervalo. La opción (d) es falsa porque la
opción (a) es verdadera.

P.2.7. El siguiente gráfico corresponde a las calificaciones (en el eje


x) de un grupo de 40 alumnos (número de alumnos en el eje y).
Indique la opción verdadera.

:o

-.
} 10
'•

(a) Más de 15 alumnos han suspendido.


(b) Un alumno que hubiese obtenido la nota media, habría suspendido.
(c) Un alumno que hubiese obtenido la nota más común no habría
suspendido.
(d) La diferencia entre la nota máxima obtenida y la mínima es igual a 7.

Solución: La opción (c).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


han suspendido 13 alumnos. La opción (b) es fa lsa porque un alumno que
hu biese obtenido la nota media, habría aprobado ya que la nota med ia es 5,3.
La opción (d) es fa lsa porque la diferencia entre la nota máxima obtenida y lé
mínima es 9.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 31

Cálculo: A continuación se describe el proceso de cálcu lo adoptado.

La distribución de frecuencias de las ca lificaciones de los alumnos es la


siguiente:

X¡ n¡ X¡ * n ¡ N¡
1 2 2 2
2 2 4 4
3 4 12 8
4 5 20 13
5 8 40 21
6 9 54 30
7 4 28 34
8 3 24 37
9 2 18 39
10 1 10 40
SUMA N = 40 212

A partir de la tabla anterior, se deduce que los alumnos suspensos son 13,
valor que corresponde a N4 •

La expresión de la media aritmética es la siguiente:


/=I O
¿ x¡n;
X=Xifli+ X2fl2 + X3fl3 + ....... +X1ofl10 = i= I = 2 12 = 5 3
n, + n2 + n3 + ... .... + n10 N 40 '

La nota más común es 6, por lo que un alumno que hubiese obtenido la nota
más común no habría suspendido.

P.2.8. Dada la siguiente distribución de frecuencias, donde se omiten


algunos datos, indique la afirmación correcta.

X¡ n¡ f¡
2 10 0,25
3
4 15 0,375
5 0,25
32 EJERCIC IOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

(a) La frecuencia total de datos no se puede calcular


(b) La frecuencia relativa del valor 3 es 0,1
(c) El cinco es el valor que menos veces se repite
(d) La frecuencia total de datos es 40

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


la frecuencia total de datos es 40. La opción (b) es falsa porque la frecuencia
relativa del valor 3 es 0,125. La opción (c) es falsa porque el valor que menos
veces se repite es el 3 que se repite 5 veces.

Cálculo: A continuación se describe el proceso de cálculo adoptado.

Para completar la distribución se debe tener en cuenta las siguientes


consideraciones.

Para calcular la frecuencia relativa que falta, aplicamos que la suma de las
frecuencias relativas ha de ser la unidad, luego el valor de la frecuencia
relativa que faltaba , correspondiente a x = 3, ha de ser = 1 - (0,25 + 0,375 +
0,25) = 1 - 0,875 = 0,125

Para calcular el número total de datos aplicamos que la frecuencia relativa se


calcula como el cociente entre la frecuencia absoluta con la que se presenta
un valor o una modalidad y la frecuencia total de datos. Por ejemplo, en el
caso de x = 1, basta con resolver la siguiente ecuación: 10/ N=0,25. De cuyo
resultado se obtiene N = 40 que es el número total de datos.

Para calcular las frecuencias absolutas que faltan, por ejemplo, en el caso de x
= 5, basta con resolver la siguiente ecuación correspondiente a la frecuencia
relativa: n5/ 40 = 0,25. De cuyo resultado se obtiene n5 = 10.

La distribución de frecuencias, una vez completados los datos que faltaban, es


la siguiente:

X¡ n¡ N¡ f¡
2 10 10 0,25
3 5 15 0, 125
4 15 30 0,375
5 10 40 0,25

En dicha tabla se observa que el valor de la x que menos veces se repte, es


decir cuya frecuencia es menor, es el 3, con una frecuencia absoluta igual a 5.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 33

P.2.9. Se representa la siguiente distribución de frecuencias en un


diagrama de tallos y hojas, correspondiendo los tallos a las decenas.
Indique cuál es la solución correcta:

37 29 25 38 16 14 31 37 33 28 28 23 17

(a) Existen 2 tallos y 13 hojas


(b) Existen 3 tallos y dos de ellos tienen 5 hojas
(c) Existen 3 t allos y en dos ellos las últimas hojas corresponden al 9.
(d) Existen 3 tallos y uno de ellos tiene 4 hojas

Solución: La opción (b ).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


existen 3 tallos y 13 hojas. La opción (c) es falsa porque existen 3 tallos y en
uno de ellos (el tallo 2) la última hoja corresponde al 9. La opción (d) es falsa
porque existen 3 tallos y ninguno de ellos tiene 4 hojas.

Cálculo: A continuación se describe el proceso de cálculo adoptado.

En primer lugar se ordenan los datos, obteniéndose la siguiente serie de


datos:

14 16 17 23 25 28 28 29 31 33 37 37 38

A continuación se elabora el diagrama de tallos y hojas. Se comienza


seleccionando los tallos que son las cifras de decenas, es decir 1, 2, 3.

A continuación se efectúa un recuento y se añade cada hoja a su tallo


correspondiente, obteniéndose, finalmente, el diagrama siguiente.

Tallos Ho ·as
1 4 6 7
2 3 5 8 8 9
3 1 3 7 7 8

P.2.10. Dada la siguiente distribución de frecuencias con los datos


agrupados en intervalos, y suponiendo que los valores
correspondieran a las ventas de un determinado producto, lCuál
sería el porcentaje que corresponde a las ventas inferiores a 41
unidades?
34 EJ ERCIC IOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

( L¡. 1 - L¡] n¡
20-30 14
30-40 4
40-50 9
50-60 3
(a) 13,3%
(b) 60%
(c) 19%
(d) Ninguna de las soluciones es correcta

Solución: La opción (b ).

Justificación: Como se demuestra a continuación, las opciones (a) y (c) son


falsas porque el porcentaje que corresponde a las ventas inferiores a 41
unidades, es el 60% . La opción (d) es falsa porque la opción (b) es verdadera .

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La frecuencia absoluta que corresponde a las ventas inferiores a 41 unidades


se obtiene a partir de la suma de las frecuencias absolutas de los dos pri meros
intervalos, es decir: 14+4 = 18

Asimismo, el total de las vent as se obtiene como la suma de todas las


frecuencias absolutas, es decir: 14+4+9+3=30

Por tanto, el porcentaje correspondiente a las ventas inferiores a 41 unidades


es: (18/30)*100 = 0,6*1 00 = 60%

P.2.11. En relación con la distribución de frecuencias siguiente, la


frecuencia relativa del tercer intervalo, expresada en forma de
porcentaje, es:

( L¡. 1 - L¡J n¡
20-30 14
30-40 4
40-50 9
50-60 3

(a) 59,99%
(b) 18%
(c) 30%
(d) Ninguna de las soluciones es correcta
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 35

Solución: La opción (c).

Justificación: Como se demuestra a continuación, las opciones (a) y (b) son


falsas porque la frecuencia relativa del tercer interva lo es el 30%. La opción
(d) es falsa porque la opción (c) es verdadera .

Cálculo: A continuación se describe el proceso de cálculo adoptado.

En la tabla siguiente se muestran las frecuencias absolutas y relativas (en


porcentajes), indicando la expresión utilizada para calcular estas últ imas.

( L¡. 1 - L¡] n¡ f¡ (%)


20-30 14 = 46,67%
(14/ 30)* 100
30-40 4 (4/30)* 100 = 13,33%
40-50 9 (9/30)*100 = 30%
50-60 3 (3/30)*100 = 10°/o

Por ejemplo, la frecuencia relativa del tercer intervalo, expresada en


porcentaje, es: (9/ 30)* 100 = 30%.

P.2.12. Los siguientes datos corresponden al número de pasajeros de


28 autobuses cuando salen de la terminal del centro de una ciudad
con destino a realizar un City Tour. Los autobuses tienen 49 asientos
cada uno y los pasajeros adicionales deben viajar de pie. Si se
construye la tabla de frecuencias asociada a la variable anterior,
considerando intervalos de amplitud 5 y de tal manera que el límite
inferior del primer intervalo coincide con el mínimo número de
pasajeros trasportados, indique la afirmación correcta .

52 50 38 42 48 55 52 51 36 47 52 53 57
56 35 36 58 49 46 50 49 52 38 41 55 48
59 49

(a) Se obtienen un total de -6 intervalos


(b) Hay un total de 3 autobuses que llevan pasajeros de pie por no tener
asientos disponibles
(c) Hay 21 autobuses que llevan al menos 40 pasaj eros
(d) Ninguna de las demás soluciones es correcta

Solución: La opción (d).


36 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


se obtienen un total de 5 intervalos. La opción (b) es fa lsa porque en los
autobuses hay 49 asientos, por lo que el número de autobuses que llevan
pasajeros de pie por falta de asientos disponibles, se corresponde con el
número de autobuses que transportan más de 49 pasajeros, que es 14. La
opción (c) es falsa porque hay un total de 23 autobuses que llevan al menos
40 pasajeros. Corresponde a todos los autobuses, es decir, 28, menos los 5
incluidos en el primer intervalo [35 - 40).

Cálculo: A continuación se describe el proceso de cálculo adoptado.

Ordenados los datos, se observa que varían entre 35 y 59; hay cinco
intervalos, el primer intervalo es [35-40) y el último el [55-60). Por tanto, la
tabla de frecuencias será la siguiente:

Frecuencias
Intervalo Frecuencias Frecuencias Frecuencias relativas relativas
de Clase absolutas acumuladas en porcentaje acumuladas en
[L¡_ 1 - L¡) (n¡) (N¡) (f¡) porcentaje
(F¡)
35-40 5 5 (5/ 28)*100) = 17,9% 17,9%
40-45 2 7 (2/28)*100) = 7,1% 25,0%
45-50 7 14 (7/ 28)* 100) = 25,0% 50,0%
50-55 8 22 (8/28)*100) = 28,6% 78,6%
55-60 6 28 (6/28)* 100) = 21,4% 100,0%

En los autobuses hay 49 asientos, por lo que el número de autobuses que


llevan pasajeros de pie por falta de asientos disponibles, se corresponde con el
número de autobuses que transportan más de 49 pasajeros, que es 14.

Hay un total de 23 autobuses que llevan al menos 40 pasajeros. Corresponde


a todos los autobuses, es decir, 28, menos los 5 incluidos en el primer
intervalo.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 37

CAPÍTULO 3. LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES


UNIDIMENSIONALES

3.1. Preguntas teóricas

T.3.1. Señale la opción falsa.

(a) La media aritmética siempre se puede calcular


(b) La media aritmética se define como la suma de todos los valores de la
variable dividida por el número total de observaciones
(c) Si se realiza un cambio de origen, la media aritmética aumenta en dicha
cantidad
(d) Las opciones (b) y (c) son verdaderas

Solución: La opción (a).

Justificación: La opción (a) es falsa porque no es posible calcular la media


aritmética para los datos cualitativos.

T.3.2. En relación con la mediana de una distribución de frecuencias,


señale la solución correcta.

(a) La mediana de una distribución de frecuencias, previamente ordenada en


orden creciente o decreciente, se define como el va lor central de la
variable que divide la distribución en dos partes iguales
(b) La mediana es sensible a los valores extremos de una distribución
(c) Los valores extremos tienen una mayor influencia que en la media
aritmética.
(d) Ninguna de las demás opciones es correcta

Solución: La opción (a).

Justificación: La mediana es una medida insensible a los va lores extremos de


la distribución, por lo que las opciones (b) y (c) son falsas. La opción (d) es
falsa porque la opción (a) es verdadera.
38 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.3.3. Señale la opción falsa en relación con la media geométrica.

(a) La media geométrica se define como la raíz de índice N del producto de


todas las observaciones elevado a sus respectivas frecuencias
(b) La media geométrica sólo se puede calcular si no hay observaciones nulas
( c) Puede no tener sentido el cálculo de la media geométrica cuando algún
valor es negativo
(d) La media geométrica no debe emplearse cuando los valores de la variable
no son de naturaleza aditiva

Solución: La opción (d).

Justificación: La opción (d) es falsa porque la media geométrica es una


medida estadística que debe emplearse cuando los valores de la variable no
son de naturaleza aditiva (tasas, ti pos de interés, porcentajes, números
índices, etc.).

T.3.4. En relación con la media armónica, indique la opción falsa.

(a) La media armónica no debe emplearse cua ndo la variable está medida en
unidades relativas
(b) Sólo se puede calcular si no hay observaciones nulas
(c) Los valores extremos t ienen una menor influ encia que en la media
aritmética
(d) Es más representativa que ot ras medidas en los casos de obtener
promedios de velocidades, rendimientos y productividades

Solución: La opción (a) .

Justificación: La opción (a) es falsa porque la media armonica sólo debe


emplearse cuando la variable está medida en unidades relativas, por ejemplo,
Km . / h., es decir, para promediar velocidades, tiempos, rendimientos, etc.

T.3.5. Indique cuál de las siguientes opciones es falsa.

(a) A la media recortada al 25% se la denomina centrimedia


(b) La mediana coincide con el segundo cuartil y divide la distribución en dos
partes igua les
(c) La media aritmética siempre puede ca lcu larse
(d) Puede no tener sentido el cálculo de la media geométrica cuando algún
valor es negativo

Solución: La opción (c).


LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 39

Justificación: La opción (c) es falsa porque la media aritmética no puede


calcu larse para cualquier tipo de datos, por ejemplo en el caso de que los
datos sean cualitativos.

T.3.6. Señale la solución correcta.

(a) La moda se define como el valor de la variable que presenta mayor


frecuencia relativa
(b) Un va lor de una variable constituye una moda relativa cuando su
frecuencia absoluta no es superada por la de sus valores contiguos
(c) En las distribuciones de frecuencias de tipo II no tiene sentido calcular la
moda
(d) Ninguna de las demás opciones es correcta

Solución: La opción (b).

Justificación: La opción (a) es falsa porque la moda se define como el valor de


la variable que presenta mayor frecuencia absoluta. La opción (c) es falsa
porq ue en las distribuciones de frecuencias de tipo II sí tiene sentido calcular
la moda. La opción (d) es falsa porque la opción (b) es verdadera .

T.3.7. En relación con las medidas robustas de tendencia central,


indique cuál es la opción falsa.

(a) La trimedia es un índice de tendencia central que consiste en calcular una


media aritmética ponderada de tres medidas: la Media geométrica (con
peso doble) y el primer y tercer cuartil
(b) La media recortada a nivel 2 implicaría eliminar las dos puntuaciones
mayores y las 2 menores
(c) Todas las medidas robustas de tendencia central tratan de paliar los
problemas de estimación asociados a distribuciones anómalas, siendo
estadísticos que funcionan bien para varios tipos distintos de distribuciones
teóricas, pero no para todas
' d) Las opciones (b) y (c) son verdaderas

Solución: La opción (a).

Justificación: La opción (a) es falsa porque la trimedia es un índice de


:endencia central que consiste en calcular una media aritmética ponderada de
rres medidas: la Mediana (con peso doble) y el primer y tercer cuarti l.
40 EJ ERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.3.8. Señale la solución correcta.

(a) Los cuantiles son los valores de la variable que dividen una distribución de
frecuencias en partes iguales
(b) Los cuartiles son cuatro valores que dividen a la serie de datos en cinco
partes iguales
(c) La mediana coincide con el segundo decil.
(d) Ninguna de las demás opciones es correcta

Solución: La opción (a).

Justificación: La opción (b) es falsa porque por su propia definición, los


cuartiles son tres valores de la variable que dividen una distribución de
frecuencias en cuatro partes iguales. La opción (c) es falsa porque la mediana
coincide con el quinto decil. La opción (d) es falsa porque la opción (a) es
verdadera.

T.3.9.Indique cuál de las siguientes opciones es falsa.

(a) En la determinación de la media geométrica intervienen todos los valores


de la distribución
(b) Los cuartiles son cuatro valores que dividen a la serie de datos en cinco
partes iguales
(c) La mediana es la medida más representativa en el caso de las variables
cua litativas o atributos
(d) Si existe la media armónica, es igual o inferior a la media geométrica

Solución: La opción (b ).

Justificación: La opción (b) es falsa porque los cuarti les son tres valores que
dividen a la serie de datos en cuatro partes iguales.

T.3.10. En relación con las medidas robustas de tendencia central,


seleccione la solución correcta.

(a) La media recortada al 25% será igual a la media aritmética.


(b) A la med ia recortada al 50% se la denomina " centrimedia"
(c) La media k-winsorizada opera de forma análoga a las medias k-recortadas,
sólo que en lugar de prescindir de los k por ciento datos más grandes y
más pequeños, se sustituyen por el valor mayor y menor de los datos
restantes
(d) Ninguna de las afirmaciones anteriores es correcta

Solución: La opción (c) .


LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 41

Justificación: La opción (a) es falsa porque la media recortada al 0% será igual


a la media aritmética. La opción (b) es falsa porque a la media recortada al
25% se la denomina " centrimedia". La opción (d) es falsa porque la opción (c)
es verdadera .

T.3.11. En relación con la media aritmética, indique la respuesta


falsa:

(a) La suma de las desviaciones de todos los va lores respecto a su media


aritmética es siempre mayor que cero
(b) Si multiplicamos o dividimos todas las observaciones por un mismo
número, la media aritmética no varía.
(c) Si le sumamos a todas las observaciones un mismo número, la media
aritmética aumentará en dicha cantidad
(d) Las opciones (a) y (c) son correctas.

Solución: La opción (b) .

Justificación: La opción (b) es falsa porque si multiplicamos o dividimos todas


las observaciones por un mismo número, la media aritmética queda
multiplicada o dividida por dicho número.

T.3.12. A partir de la distribución que se muestra en la tabla adjunta,


indique cuál es la opción verdadera.

1 ~ ! ~ ~
1 1 1 1 ; 1 ! 1

(a) La media aritmética es 3,0


(b) La mediana y la moda coinciden .
(c) La moda es mayor que la mediana.
(d) Ninguna de las opciones es correcta .

Solución: La opción (b).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


la media aritmética es aproximadamente 3,24. La opción (c) es falsa porque
la moda y la med iana coinciden y son igua les a 3. La opción (d) es falsa
porque la opción (b) es verdadera.

Cálculo: Para obtener las medidas solicitadas, construimos la siguiente tabla


auxiliar
42 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

X¡ n¡ X¡.n¡ N¡
1 3 3 3
2 2 4 5
3 7 21 12
4 5 20 17
5 4 20 21
SUMA= N = 21 SUMA= 68

A partir de la tabla anterior, se obtiene la media aritmética mediante la


expresión siguiente :

Para calcular la mediana, se obtiene en primer lugar, N/ 2 = 10,5. El primer


valor que iguala o supera a N = 10,5 en la columna de las N¡ es 12. El valor X¡
correspondiente a 12 es 3, luego la mediana es 3.

La moda es el valor de la variable que se repite más veces, es decir, el valor


de la variable que presenta mayor frecuencia absoluta. Por tanto, la moda es
3.

T.3.13. De una distribución de frecuencias unidimensional se conoce


el valor mínimo = -3, y el recorrido R = 6. Indique la solución falsa.

(a) La media aritmética no puede ser menor que -3 (< -3)


(b) La media aritmética no puede ser mayor que 3 (> 3)
(c) La mediana no puede ser negativa (< O)
(d) La media armónica puede ser negativa (< O)

Solución: La opción (c).

Justificac16n: La opción (c) es falsa porque la mediana puede ser negativa ya


que al ser el valor mínimo -3 y el recorrido 6, el valor máximo será 3 y por
tanto la media aritmética, la media armónica y la mediana deben pertenecer al
intervalo de variación de la variable que es el intervalo delimitado por -3 y 3.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 43

T.3.14. Indique cuál de las siguientes opciones es falsa.

(a) La media k-recortada elimina el efecto de los valores extremos en el caso


en que la proporción de los mismos en cada extremo sea inferior a k; de
este modo, puede considerarse un remedio muy adecuado para la "falta
de robustez" de la media.
(b) La media geométrica es menos sensible que la media aritmética cuando la
distribución tiene valores extremos
(e) Las soluciones (a) y (b) son verdaderas
(d) Si existe la media geométrica, es igual o su perior a la media aritmética.

Solución: La opción (d).

Justificación: La opción (d) es falsa porque si existe la media geométrica, es


igual o inferior a la media aritmética, es decir, puede ser menor que la media
aritmética.
44 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

3.2. Problemas

P.3.1. A partir de los siguientes datos, determine la solución correcta.

(a) El va lor de la media aritmética es 3,4


(b) La media recortada al 20% toma el va lor de 3,1
(c) La media winsorizada a nivel 2 toma el valor de 3,3
(d) Ninguna de las demás opciones es correcta

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es fa lsa porque


el valor de la media aritmética es 3,3. La opción (b) es falsa porque el valor de
la media recortada al 20% es 3. La opción (c) es falsa porque el valor de la
media winsorizada a nivel 2 es 3,2.

Cálculo: A continuación se describe el proceso de cálculo adoptado .

10
¿ x,
La media aritmética se calcula de la forma siguiente: X =_,__, - = 33 = 3,3
10 10

La media recortada al 20% implicaría eliminar las dos puntuaciones (20% de


10), mayores y las 2 menores, es decir, calcularíamos la media aritmética de
los siguientes datos.

6
¿ x,
1• 1 - = ~ = 3
Cuyo valor es el siguiente : x =-
6 6

En la media winsorizada a nivel 2, los datos 1 y 1 (los dos menores) y el 6 y 7


(los dos mayores) se sustituyen por el valor mayor y menor de los datos
restantes, es decir, 2 y 5, respectivamente. Por tanto, calculamos la media de
los siguientes datos.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 45

o
1

¿ x,
1~1 32 3 2
euyo va1ores: -
X=IO =TO= ,

P.3.2. A partir de los siguientes datos, determine la solución correcta.

1,2 2,1 2, 2 2,7 3,1 1 4,2 5,7 6,1

(a) El valor de la media aritmética es 6,15 y la mediana es 2,5


(b) La media recortada al 25% toma el va lor de 3,525 aproximadamente
(c) La media winsorizada a nivel 1 toma el valor de 3,475 y la mediana es 2,7
(d) Ninguna de las demás opciones es correcta

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


el va lor de la media aritmética es 6, 15 y la mediana es 2,9. La opción (b) es
falsa porque el valor de la media recortada al 25% es 3,05. La opción (c) es
falsa porque el valor de la media winsorizada a nivel 1 es 3,475 y la mediana
es 2,9.

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La media aritmética de los valores se ca lcula mediante la expresión:


8

¿xi
X=.M_= 615
8 ,

Para calcular la mediana, se ordenan los datos en primer lugar:

1 1,2 1 2,1 1 2,2 1 2,7 1 3,1 1 4,2 1 5,7 1 6,1

Al ser N = 8 un número par, debemos fijarnos en los dos términos centrales,


es decir, los que ocupan la posición 4ª y 5ª (2,7 y 3,1) y la mediana vendrá
dada por:
M = 2, 7 + 3,1 = 2 9
e 2 .

La media recortada al k por ciento es la media de los datos que quedan


después de eliminar el k por ciento de los datos más grandes y el k por ciento
de los datos más pequeños. Por tanto, la media recortada al 25% implicaría
eliminar las dos puntuaciones ( 25% de 8) mayores y las dos menores, es
decir, se calcularía la media de los siguientes datos.
46 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

2,2 2,7 3,1 4,2


4
LX¡
- i=I
X= - 12,2
-= - -= 3 05
Cuyo valor es:
4 4 '

Para obtener la media winsorizada a nivel 1, los datos 1,2 y 6,1 se sustituyen
por 2,1 y 5,7 respectivamente. Es decir, calcularemos la media de los
siguientes datos.

1 2,1 1 2,1 1 2,2 2,7 3,1 4,2 5,7 5,7

8
_Lx¡
Cuyo valor es: X = i=~ = 3,4 7 5

P.3.3. A partir de los siguientes datos, determine la solución falsa.

1 1,2 1 2,1 1 2,2 1 2,7 1 3,1 1 4,2 1 5,7 6,1

(a) El valor de la mediana es 2,9


(b) La media recortada al 25% toma el valor 3,05
(c) La media winsorizada a nivel 2 toma el valor 2,85
(d) Ninguna de las opciones es correcta

Solución: La opción (c).

Justificación: Como se demuestra a continuación, la opción (c) es falsa porque


el valor de la media winsorizada a nivel 2 es 3,125.

Cálculo: A continuación se describe el proceso de cálculo adoptado.

Para calcular la mediana, en primer lugar se ordenan los datos:

1 1,2 1 2,1 1 2,2 1 2,7 1 3,1 1 4,2 1 5,7 1 6,1 1

Al ser N = 8 un número par, debemos fijarnos en los dos términos centrales,


es decir, los que ocupan la posición 4ª y 5ª (2,7 y 3,1) y la mediana vendrá
dada por:
M = 2,7 + 3,1 = 2 9
e 2 '
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 47

La media recortada al k por ciento es la media de los datos que quedan


después de eliminar el k por ciento de los datos más grandes y el k por ciento
de los datos más pequeños. Por tanto, la media recortada al 25% implicaría
eliminar las dos puntuaciones (25% de 8) mayores y las dos menores, es
decir, se calcularía la media de los siguientes datos.

1 2,2 2,7 3,1 4,2


4

¿x,
Cuyo valor es: X =~=
4 3 05 I

Para el cálculo de la media winsorizada a nivel 2, los dos datos mayores y


menores se sustituyen por 2,2 y 4,2, respectivamente. Es decir, calcularemos
la media aritmética de los siguientes datos.

1 2,2 1 2,2 1 2,2 1 2,7 1 3,1 1 4,2 1 4,2 1 4,2 1

8
¿ x,
Cuyo valor es: X = ....!::!._
8 =3 , 125

P.3.4. Dado el siguiente diagrama de tallos y hojas, señale la solución


correcta.

1 1
2 1 1 2 2 3 2 1
3 3 5 3 3 3
4 1 1

(a) El mayor n¡ es 5 y la media es menor de 26


(b) La diferencia entre el tercer cuartil y la mediana es 12
(c) El primer cuartil es mayor de 23
(d) Ninguna de las demás opciones es correcta

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


el mayor n¡ es 4 y la media es aproximadamente 27,467. La opción (b) es falsa
porque la diferencia entre el tercer cuartil y la mediana es 10. La opción (c) es
falsa porque el primer cuartil es 21.
48 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE

Cálculo: A continuación se describe el proceso de cálcu lo adoptado.

La tabla de frecuencias de la distribución es la siguiente:

X¡ n¡ N¡ X¡* n ¡
11 1 1 11
21 3 4 63
22 3 7 66
23 1 8 23
33 4 12 132
35 1 13 35
41 2 15 82
SUMA= 15 SUMA = 412

Para el cálcu lo de la media se utiliza la expresión siguiente:


=7
¿ x,n,
x= ..l=.L_
N
=
4 12
15
= 27.467

Para el cálculo del primer cuartil se procede como sigue:


. l · N 15
En primer lugar se procede a obtener : - = - = 3,7 5
4 4
El primer valor que supera a 3,75 en la columna de N¡ es la frecuencia
acumulada 4, que corresponde al valor de la variable X¡ = 21 ; luego Q1 = 21.

El segundo cuartil Q2 coincide con la mediana, para su cálculo se procede


como sigue:
2· N 30
En primer lugar se obtiene el valor -
4
- = 4 = 7,5
El primer valor que lo supera en la columna N¡ es el 8; que corresponde a X¡ =
23; la mediana o Q2 es, en consecuencia, el valor 23 .

El tercer cuartil Q3 se calcula como sigue:


3· N 45
Se obtiene la magnitud : - - = = 1 1,25
4 4
El primer valor que lo supera en la columna N¡ es el 12 que corresponde a X¡ =
33; luego Q3 = 33 .

P.3.5. A partir de los siguientes valores que corresponden al número


de coches de una serie de familias encuestadas, indique la solución
correcta.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 49

1 7 1 1 1 3 1 7 1 3 7

(a) La mediana no se puede calcular


(b) El valor de la mediana es 5 y la media aritmética es menor de 5
(c) La distribución anterior es de tipo II y la mediana toma el valor 5
(d) Ninguna de las demás opciones es correcta

Solución: La opción (b ).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


la mediana es 5. La opción (c) es falsa porque la distribución es de tipo I. La
opción ( d) es falsa porque la opción (b) es verdadera .

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La distribución anterior es del tipo I.

Para el cálculo de la mediana, en primer lugar se ordenan los valores de


menor a mayor, obteniéndose el resultado siguiente.

1 1 1 3 1 3 1 7 1 7 1 7 1

En segundo lugar, como el número total de observaciones es un número par


(N = 6), la mediana se calcula mediante la media aritmética de los dos
térmi nos centrales, es decir, los que ocupan la posición 3ª y 4ª (3 y 7) y la
3+7
mediana vendrá dada por: Me= - -
2
=5
- 1+ 3 +3+ 7 + 7+7
Asimismo, la media aritmética es: X= ;:::: 4,667
6

P.3.6. Determine la opción correcta en relación con la siguiente


distribución de frecuencias, correspondiente a los días de vacaciones
disponibles de los trabajadores de una empresa:

L,_ , - L, (n¡)

[O - 5) 1.000
[5 - 10) 2.200
[10 - 15) 4.300
[15-20) 3.300
50 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

(a) El va lor de la moda es 12 y la media aritmética es menor que ella


(b) El valor de la moda es 13 y la media aritmética es mayor que ella
(c) El valor de la moda es 13 y el valor de la amplitud de los intervalos es 5
(d) Ninguna de las demás opciones es correcta

Solución: La opción (c).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


la moda es 13 y la media aritmética es menor (12,08). La opción (b) es falsa
porque la moda es 13 y la media aritmética es menor (12,08). La opción (d)
es falsa porque la opción ( c) es verdadera.

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La amplitud de los intervalos es 5, ya que al restar el límite superior menos el


límite inferior de cualquier intervalo se obtiene este valor, por ejemplo:
C¡ = [¡ - [ ¡. 1 = 5 - O= 5

Para obtener la media en la distribución anterior se calculan las marcas de


clase mediante la expresión m, =X; = L,.,; L, , obteniéndose la tabla siguiente:

L,_1 - L, (n¡) X¡ (n¡)*X¡


[O - 5) 1.000 2,50 2.500
[ 5 - 10) 2.200 7,50 16.500
[ 10 - 15) 4.300 12,50 53 .750
[15-20) 3.300 17,50 57 .750
SUMA= 10.800 SUMA = 130.500

La media aritmética, sería:

El intervalo modal es el intervalo [10 - 15), con una frecuencia absoluta de


4.300 que es superior a la de los demás intervalos. Al tener todos los
intervalos la misma longitud la moda se calcula como sigue:

M =L . + n;+i ·c.= 1O+ 33 00 · 5=13


O t- I
n ;_ 1 + n;+i I 2200+ 3300
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 51

P.3.7. Dada la siguiente tabla de frecuencias, señale la solución


correcta.

X¡ 1 2 3 4 5 6 7 8 9 10
n¡ 2 7 8 8 22 3 13 17 7 13

( a) La media es menor de 5
( b) La diferencia entre la mediana y el segundo cuartil es 3
(c) El valor del tercer cuartil es 8
(d) Ninguna de las demás opciones es correcta

Solu ción: La opción ( c).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


ia media es 6,2. La opción (b) es falsa porque la diferencia entre la mediana y
~ segundo cuartil es O. La opción (d) es falsa porque la opción (c) es
verdadera.

Cálc ulo: A continuación se describe el proceso de cálculo adoptado.

_a tabla de frecuencias de la distribución es la siguiente:

X¡ n¡ N¡ X¡* n¡
1 2 2 2
2 7 9 14
3 8 17 24
4 8 25 32
5 22 47 110
6 3 50 18
7 13 63 91
8 17 80 136
9 7 87 63
10 13 100 130
SUMA= 100 SUMA= 620

Para el cálculo de la media se utiliza la expresión siguiente:


=10

¿x¡n¡
X= i=I = 620 = 6 2
N 10 0 '
52 EJERCICIOS DE TEST PARA INTRODU CCIÓN A LA ESTADISTICA DE ADE

Para el cálculo del primer cuartil se procede como sigue:


l · N 100
En primer lugar, se procede a obtener: - - =
4
= 25 4
Al existir un valor que coincide con 25 en la columna de N¡, que corresponde al
valor de la variable X; = 4; el valor del primer cuartil corresponde a la
4 +5
semisuma de 4 y 5. 01= - - = 4,5
2
El segundo cuartil Q2 coincide con la mediana, para su cálculo se procede de
forma análoga al primer cuartil :
2·N 200
En primer lugar se obtiene el valor: -
4
- = 4 = 50

Al existir un valor que coi ncide con 50 en la columna de Ni, que corresponde
al valor de la variable xi = 6; el valor del segundo cuartil corresponde a la
6 +7
semisuma de 6 y 7. Es decir, 02 = - - = 6,5
2

El tercer cuartil Q3 se calcula utilizando el mismo método.


3· N 300
Se calcu la -
4
- = 4 = 75
El primer valor que lo supera en la columna N¡ es 80 que corresponde a X¡ = 8;
Luego Q3 = 8

P.3.8. Los siguientes valores corresponden al número de hijos de una


serie de familias encuestadas. Seleccione la opción correcta.

1 3 1 1 1 1 1 2 1 2 1 o o
1

(a) La mediana es mayor que la media aritmética


(b) La mediana toma el valor 1, y la media geométrica el valor 0,5
( c) La distribución anterior es de tipo 1 y la media aritmética toma el va lor 1
(d) Ninguna de las demás opciones es correcta

Solución: La opción (d) .

Justificao6n: Como se demuestra a continuación, la opción (a) es falsa porque


la mediana es 1 y la media aritmética 1,29, por lo que la mediana es menor
que la media aritmética . La opción (b) es falsa porque la mediana toma el
valor 1, y la media geométrica no puede calcularse al existir un valor nu lo. La
opción (c) es falsa porque la distribución es de tipo 1 y la media aritmética
toma el valor 1,29.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 53

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La distribución anterior es del tipo I.

Para el cálculo de la mediana, en primer lugar se ordenan los valores de


menor a mayor. El resultado es el que sigue:

1 o o
1 1 1 1 1 2
1 1 2 1 3 1

En segundo lugar se calcula N = 7 que es un número impar, por lo que la


mediana vendrá dada por el valor central, 1, que deja a su izquierda la misma
masa (3 va lores,) que a su derecha (3 valores).

Para el cálculo de la media aritmética se utiliza la expresión siguiente:

x= o+ o + 1+ 1+ 2 + 2 + 3 ~ 129
7 '
La media geométrica no puede calcularse al existir un valor nulo.

P.3.9. En relación con la siguiente distribución de frecuencias, en la


que se indica el grado de satisfacción (valoración de O a 10) de 100
dientes que han utilizado el servicio de un taller de automóviles,
indique cuál es la opción verdadera.

(a) Más de la mitad de los clientes han dado puntuaciones iguales o superiores
a 5,5.
(b) La med ia na y la media aritmética coinciden
{c) La mediana es mayor que la media aritmética
{d) La mediana es menor que la media aritmética

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


al ser la mediana igual a 5, más de la mitad de los clientes han dado
puntuaciones iguales o superiores a 5. Las opciones (b) y (c) son falsas
porque las magnitudes de la mediana y de la media aritmética son,
respectivamente, 5 y 5,3, y por tanto, la mediana es menor que la media
aritmética.
54 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Cálculo: A continuación se describe el proceso de cálculo adoptado .


La tabla de frecuencias de la distribución es la siguiente :

X¡ n¡ N; X;* n ¡
1 2 2 2
2 3 5 6
3 4 9 12
4 11 20 44
5 45 65 225
6 7 72 42
7 13 85 91
8 7 92 56
9 5 97 45
10 3 100 30
SUMA = 553

Para calcular la mediana, a partir de la columna N; que es la columna de


frecuencias absolutas acumuladas; obtenemos el valor N/ 2 = 50; el primer
valor que lo supera en la columna N; es el 65; que corresponde a x; = 5; por
tanto, la mediana es el valor 5.

Se podría decir, en consecuencia, que más de la mitad de los clientes han


dado puntuaciones iguales o superiores a 5.
=5
¿ x,n;
Para el cálculo de la media, se utiliza la expresión: X=-'--N = 553
1
-
100
= 5 53
'
Por lo que la media es mayor que la mediana.

P.3.10. Determine la solución correcta en relación con la siguiente


distribución de frecuencias:

(a) El primer cuartil y el segu ndo coinciden


(b) El primer cuartil es menor que el segundo cuartil cuyo valor es 5
(c) El segundo y el tercer cuartil coinciden
(d) Ninguna de las demás opciones es correcta
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCI ONES UNIDIMENSIONALES 55

Solución: La opción (a).

Justificación: Como se demuestra a continuación, la opción (b) es falsa porque


el primer cuartil es 5 y el segundo es también 5. La opción ( c) es falsa porque
el seg undo cuartil es 5 y el tercer cuartil es 7, luego son diferentes. La opción
(d) es falsa porque la opción (a) es verdadera .

C.álculo: A continuación se describe el proceso de cálculo adoptado.

La tabla de frecuencias de la distribución, es la sig uiente:

X; n; N; X;* n ;
1 2 2 2
2 3 5 6
3 4 9 12
4 11 20 44
5 45 65 225
6 7 72 42
7 13 85 91
8 7 92 56
9 5 97 45
10 3 100 30
SUMA= 553

?ara el cálculo del primer cuartil se procede de la forma siguiente:


e~ primer
u, . Iugar se o bt'1ene -1· N = -100 = 25
4 4
a primer valor que supera a 25 en la columna de N; es la frecuencia
ccumulada 65, que corresponde al valor de la variable X; = 5; luego Q1 = 5.
3 seg undo cuartil Q2 coincide con la mediana y para calcularlo, se obtiene en
. 2· N 200
nnmer lugar: - =- = 50
4 4
3 primer valor que supera a 50 en la columna de N; es la frecuencia
acumulada 65, que corresponde al valor de la variable X; 5; luego la =
mediana o Q2 es 5.

3 300
Para el cálcu lo del tercer cuartil Q3 se obtiene: ·N = = 75
4 4

El primer va lor que supera a 75 en la columna de N; es la frecuencia


acumulada 85, que corresponde al valor de la variable X; = 7 ; luego Q3 = 7.
56 EJ ERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

CAPÍTULO 4. LAS MEDIDAS DE DISPERSIÓN, DE FORMA Y


CONCENTRACIÓN EN DISTRIBUCIONES UNIDIMENSIONALES

4 .1. Preguntas Teóricas

T.4.1. Indique la respuesta correcta .

(a) Las medidas de posición investigan la distancia entre los valores de la


distribución y los valores centrales
(b) Las medidas de posición son siempre suficientes para resumir las
características fundamentales de una distribución
( c) Las medidas de asimetría y de curtosis son medidas de forma
(d) Ninguna de las demás opciones es correcta

Solución: La opción (c).

Justificación: La opción (a) es falsa porque las medidas de dispersión son las
que investigan la distancia entre los valores de la distribución y los valores
centrales. La opción (b) es falsa porque las medidas de posición pueden ser
insuficientes para resumir las características de una distribución. La opción (d)
es falsa porque la opción (c) es verdadera.

T.4.2. Indique la respuesta correcta.

(a) El rango de una distribución se define como la diferencia entre el menor y


el mayor valor de la distribución
(b) El rango de una distribución se define como la relación entre el mayor y el
menor valor
(c) El rango de una distribución se define como la diferencia entre el tercer y
el primer cuartil de la distribución
( d) Ninguna de las demás opciones es correcta

Soluo6n: La opción ( d).

Justificación: Las opciones (a), (b) y (c) son falsas porque el rango de una
distribución se define como la diferencia entre el mayor y el menor valor de la
distribución.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 57

T.4.3. Indique la respuesta correcta.

(a) El rango de una distribución se define como la diferencia entre el menor y


el mayor valor de la distribución
(b) El coeficiente de apertura de una distribución se define como la relación
entre el mayor y el menor valor
(c) El Rango entre percentiles, se define como la diferencia entre el percentil
99 y el 100
(d) Ninguna de las demás es correcta

Solución: La opción (b ).

Justificación: La opción (a) es falsa porque el rango de una distribución se


define como la diferencia entre el mayor y el menor valor de la distribución.
La opción (c) es falsa porque el rango entre percentiles, se define como la
diferencia entre el percentil 90 y el 100. La opción (d) es falsa porque la
opción (b) es verdadera.

T.4.4. Indique la respuesta correcta.

(a) Los deciles son una medida central


(b) La mediana es una medida de posición
(c) El rango entre percentiles, se define como la diferencia entre el percentil
99 y el 100
(d) Ninguna de las demás es correcta

Solución: La opción (b).

Justificación: La opción (a) es falsa porque los deciles son una medida de
posición. La opción (c) es falsa porque el rango entre percentiles se define
como la diferencia entre el percentil 90 y el 10. La opción (d) es fa lsa porque
la opción (b) es verdadera.

T.4.5. Indique la respuesta falsa.

(a) El recorrido relativo se define como el cociente entre el recorrido y la


media aritmética
(b) El recorrido relativo expresa el número de veces que el recorrido contiene
a la media aritmética
(c) El recorrido semiintercuartílico se define como el cociente entre el recorrido
intercuartílico y la diferencia del primer y tercer cuartil.
(d) El coeficiente de apertura de una distribución se define como la relación
entre el mayor y el menor valor
58 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Solución: La opción ( c).

Justificación: La opción (c) es falsa porque el recorrido semi-intercuartílico se


define como el cociente entre el recorrido intercuartílico y la suma del primer y
tercer cuartil.

T.4.6. Indique la respuesta correcta.

(a) El recorrido relativo se define como el cociente entre el recorrido y la


mediana
(b) El recorrido relativo expresa el número de veces que el recorrido contiene
a la mediana
( c) El recorrido semi-intercuartílico queda definido como el cociente entre el
recorrido intercuartílico y la diferencia entre el primer y el tercer cuartil
(d) La Desviación media o Desviación absoluta media se define como la media
de los valores absolutos de las desviaciones respecto a la media aritmética

Solución: La opción (d).

Justificación: La opción (a) es falsa porque el recorrido relativo se define como


el cociente entre el recorrido y la media aritmética. La opción (b) es falsa
porque el recorrido relativo expresa el número de veces que el recorrido
contiene a la media aritmética. La opción (c) es falsa ya que el recorrido semi -
intercuartílico queda definido como el cociente entre el recorrido intercuartílico
y la suma del primer y tercer cuartil.

T.4.7. Indique la opción correcta.

(a) Una desviación típica pequeña significa que todos los valores de la
distribución se sitúan próximos a la media
(b) Ninguna de las demás opciones es correcta
(c) La varianza de una distribución se define como la mediana de los
cuadrados de las desviaciones respecto a la media;
(d) La desviación mediana se define como la media de los valores absolutos
de las desviaciones respecto a la media aritmética

Solución: La opción (a) .

Justificación: La opción (b) es falsa porque la opción (a) es verdadera . La


opción (c) es falsa porque la varianza de una distribución se define como la
media de los cuadrados de las desviaciones respecto a la media. La opción (d)
es falsa porque la desviación med iana se define como la media de los valores
absolutos de las desviaciones respecto a la mediana.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 59

T.4.8. Indique la respuesta falsa.

(a) Una desviación típica pequeña significa que todos los valores de la
distribución se sitúan próximos a la media
(b) La desviación típica es siempre mayor o igual que cero
(e) La desviación típica está afectada por cambios de escala
(d) La desviación típica está afectada por cambios de origen

Solución: La opción (d).

Justificación: La opción (d) es falsa porque la desviación típica no está


afectada por cambios de origen.

T.4.9. Indique la respuesta correcta.

(a) Una desviación típica grande significa que todos los valores de la
distribución se sitúan próximos a la media
(b) La desviación típica puede ser menor que cero
(e) La desviación típica está afectada por cambios de escala
(d) La desviación típica está afectada por cambios de origen

Solución: La opción (c).

Justificación: La opción (a) es falsa porque cuando una desviación típica es


oeq ueña, es cuando se puede afirmar que los valores de la distribución están
oróxi mos a la media. La opción (b) es falsa porque la desviación típica nunca
ouede ser menor que cero. La opción (d) es falsa porque la desviación típica
no está afectada por cam bios de origen.

T.4. 10. Indique la respuesta correcta.

(a) La diferencia entre la Cuasidesviación típica y la desviación típica, es que


en la expresión de la Cuasidesviación típica se divide por n en vez de por
n-1
(b) Si la variable viene medida en segundos la varianza vendrá en segundos al
cuadrado
(e) Al momento de orden uno respecto a la media se le denomina varianza
(d) Ninguna de las anteriores es correcta

Solución: La opción (b ).
60 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Justificación: La opción (a) es falsa porque la diferencia entre la


Cuasidesviación típica y la desviación típica, es que en la expresión de la
Cuasidesviación típica se divide por n-1, en vez de por n. La opción ( c) es
falsa porque al momento de orden uno respecto a la media no se le denomina
varianza. La opción (d) es falsa porque la opción (b) es verdadera.

T.4.11 . Indique la respuesta correcta.

(a) La diferencia entre la Cuasidesviación típica y la desviación típica, es que


en la expresión de la Cuasidesviación típica se divide por n en vez de por
n-1
(b) El Coeficiente de Variación de Pearson se define como el cociente entre la
desviación típica y la mediana
(c) El Coeficiente de Variación de Pearson viene dado en la misma medida que
la variable
(d) Ninguna de las anteriores es correcta

Solución: La opción (d).

Justificación: La opción (a) es fa lsa porque la diferencia entre la


Cuasidesviación típica y la desviación típica, es que en la expresión de la
Cuasidesviación típica se divide por n-1 en vez de por n. La opción (b) es
falsa porque el Coeficiente de Variación de Pearson se define como el cociente
entre la desviación típica y la media aritmética. La opción (c) es falsa porque
el Coeficiente de Variación de Pearson es adimensional.

T.4.12. Indique la respuesta correcta.

(a) El Coeficiente de Variación de Pearson es afectado por cambios de origen


(b) El Coeficiente de Variación de Pearson es afectado por cambios de escala
(c) El Coeficiente de Variación de Pearson está dado en la misma medida que
la variable.
(d) Ninguna de las anteriores es correcta

Solución: La opción (a).

Justificación: La opción (b) es falsa porque el Coeficiente de Variación de


Pearson no es afectado por cambios de escala . La opción (c) es falsa porque
el Coeficiente de Variación de Pearson es adimensional. La opción (d) es falsa
porque la opción (a) es verdadera.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 61

T.4.13. Indique la respuesta correcta.

(a) Valores menores de la unidad en el coeficiente de Variación de Pea rson


indican que el promedio representa inadecuadamente a la distribución de
frecuencias
(b) El Coeficiente de Variación de Pearson viene afectado por cambios de
escala
(c) Valores iguales a la unidad en el coeficiente de Variación de Pea rson
indican que la representatividad de la media es máxima
(d) Ninguna de las anteriores es correcta

Solución: La opción (d).

Justificación: La opción (a) es falsa porque valores menores de la unidad nos


indican que el promedio representa adecuadamente a la distribución de
frecuencias, al ser la dispersión inferior a la media aritmética. La opción (b) es
~Isa porque el Coeficiente de Variación de Pearson es adimensional y no
ifc3rÍa, por ta nto, ante cambios de escala. La opción (c) es falsa porque la
-epresentatividad de la media es máxima cuando el Coeficiente de Variación
e Pearson toma valores cercanos a cero.

T.4.14. Indique la respuesta correcta.

{a) Las medidas de asimetría son medidas que tratan de indicar el grado de
simetría con el que se agrupan los valores de una distribución en torno a
sus medidas centrales
ro) El Coeficiente de asimetría de Fisher, está relacionado con la mediana y
con los cuartiles
' e) El Coeficiente de asimetría de Bowley está basado en el momento de
segundo orden
(d) Ninguna de las anteriores es correcta

Solución: La opción (a).

JustificaciÓ17'. La opción (b) es falsa porque el Coeficiente de asimetría de


Rsher está basado en el momento de tercer orden . La opción (c) es falsa
porque el Coeficiente de asimetría de Bowley está relacionado con la mediana
y con los cuartiles. La opción (d) es falsa porque la opción (a) es correcta.
62 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.4.15. Indique la respuesta correcta.

(a) Las medidas de curtosis son medidas que tratan de indicar el grado de
simetría con el que se agrupan los valores de una distribución en torno a
sus medidas centrales
(b) Las medidas de apuntamiento o curtosis tratan de estudiar la distribución
de frecuencias en la zona media, es decir, el mayor o menor número de
valores de la variable alrededor de la mediana
( c) El Coeficiente de Curtosis de Fisher mide el grado de apuntamiento de la
distribución
( d) Ninguna de las anteriores es correcta

Solución: La opción (c).

Justificación: Las opciones (a) y (b) son falsas porque las medidas de
apuntamiento o curtosis tratan de estudiar la distribución de frecuencias en la
zona media, es decir, el mayor o menor número de valores de la variable
alrededor de la media dará lugar a una distribución más o menos apuntada. La
opción (d) es falsa porque la opción (c) es correcta.

T.4.16. La desviación típica es una medida de:

(a) Posición
(b) Simetría
(c) Dispersión
(d) Ninguna de las anteriores es correcta

Solución: La opción (c).

Justificación: Las opciones (a) y (b) son falsas porque la desviación típica es
una medida de dispersión. La opción (d) es falsa porque la opción (c) es
correcta.

T.4.17. El rango intercuartílico es una medida de:

(a) Curtosis
(b) Tendencia central
( c) Dispersión
(d) Las opciones (a) y (c) son verdaderas

Solución: La opción (c).


LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UN IDIMENSIONALES 63

Justificación: Las opciones (a) y (b) son falsas porque el rango intercuartílico
es una medida de dispersión . La opción (d) es falsa porque la opción (a) es
falsa.

T.4.18. Si a las variables estadísticas X e Y las sometemos a un


cambio de origen y de escala:

(a) Sus varianzas quedan afectadas por el cambio de ori gen


(b) Sus varianzas quedan afectadas por ambos cambios
(e) Sus varianzas quedan afectadas por el cambio de escala
(d) Sus varianzas no quedan afectadas por ninguno de los cambios

Solución: La opción (c).

Justificación: Las opciones (a), (b) y (d) son falsas porque la varianza de una
1ariable sólo se ve afectada por los cambios de escala, no así de origen.

T.4.19. Si el índice de curtosis de Fisher es igual a O, podemos


afirmar que:

'a) La distribución es asimétrica a la derecha


) La distribución es platicúrtica
1
c) La distribución es mesocúrtica
' d) Las opciones (a) y (c) son correctas

Solución: La opción (c) .

Justificaciórr. Las opciones (a), (b) y (d) son falsas porque si el coeficiente de
rurtosis de Fisher es igual a O, la distribución es mesocúrtica.

T.4.20. Para el caso de una variable con 10 valores diferentes, lcuál


de las siguientes opciones es falsa?

{a) La varianza es menor que la cuasivarianza.


!b) La varianza es igual a la cuasivarianza multiplicada por 0,9
(e) Cuando se trata con datos muestrales es mejor obtener la va rianza que la
cuasivarianza
(d) La cuasidesviación típica es siempre mayor o igual que cero

Solución: La opción (c) .

Justificación: La opción (c) es fa lsa porque cuando se trata con datos


muestrales es mejor obtener la cuasivarianza que la varianza.
64 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.4.21. Si las observaciones de las estaturas de los jugadores de un


equipo de la NBA que están medidas en pies, las pasamos a metros y
centímetros, sucede que:

(a) La mediana no queda modificada.


(b) El coeficiente de variación no queda afectado.
(c) La varianza no queda afectada por la transformación.
(d) El recorrido no varía.

Solución: La opción (b).

Justificación: La opción (a) es falsa porque la mediana queda modificada al


cambiar de escala. La opción (c) es falsa porque la varianza queda afectada al
cambiar de escala. La opción (d) es falsa porque el recorrido varía.

T.4.22. Se ha obtenido que el índice de Gini de la distribución de la


renta correspondiente a Argentina es 0,6, mientras que el
correspondiente a Turquía es 0,5. Indique cuál de las opciones
siguientes es verdadera.

(a) La distribución de la renta en Argentina es menos equitativa que en


Turquía
(b) La curva de Lorentz de Argentina está más próxima a la diagonal que la de
Turquía
(c) Existe un error en los cálculos ya que el índice de Gini no puede ser menor
de 1
(d) Ninguna de las otras opciones es verdadera

Solución: La opción (a).

Justificación: La opción (b) es falsa porque si el índice de Gini de la


distribución de la renta correspondiente a Argentina es mayor que el
correspondiente a Turquía, debe ser la distribución de la renta en Argentina
menos equitativa que en Turquía y por tanto, por la propia construcción de la
curva de Lorentz, la curva de Lorentz de Turquía debe estar más próxima a la
diagonal que la de Argentina. En este sentido, cabe recordar que la curva de
Lorenz es una forma gráfica de mostrar la dispersión o concentración de una
distribución; la curva parte del origen (0,0) y termina en el punto (100, 100); sí
la variable estuviese distribuida de forma equitativa la curva coincidiría con la
línea de 45 grados que pasa por el origen o diagonal del primer cuadrante,
mientras que si es totalmente desigual (un valor concentra toda la masa de la
distribución) la curva coincidiría con el eje horizontal hasta el punto (100,0)
donde saltaría al punto (100,100); en general la curva se encuentra en una
situación intermedia entre estos dos extremos y cuanto más se aproxime a la
LAS MEDIDAS DE POS ICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 65

diagonal, más equitativa o menos concentrada es la distribución de la renta.

La opción (c) es falsa porque el índice de Gini puede ser menor que l. La
opción (d) es falsa porque la opción (a) es verdadera .

T.4.23. En relación con el índice de Gini y la curva de Lorentz de la


distribución de salarios en empresas, indique cuál de las opciones
siguientes es verdadera.

(a) Cuanto menor es el índice de Gini, más se separa la curva de Lorentz de la


diagonal
(b) Si el índice de Gini es cero existe un error en los cálculos
(c) Cuanto mayor sea el índice de Gini, la distribución de salarios es menos
equitativa
(d) Ninguna de las otras opciones es verdadera

Solución: La opción (c).

Justificación: La opción (a) es falsa porque el Índice de Gini es


aproximadamente el área comprendida entre la diagonal y la curva de Lorenz,
dividida por el área del triángulo formado por los puntos (O, O), (100, O) y
( 100, 100); por tanto cuanto menor es este área, más se aproxima la curva de
Lorentz a la diagonal. La opción (b) es falsa porque el índice de Gini puede
tomar el valor O. La opción (d) es falsa porque la opción (c) es verdadera .

T.4.24. Indique cuál es la afirmación correcta respecto al índice de


Gini.

1
a) Permite poner de relieve el grado de igualdad o equidad en la distribución
del total de los valores de una variable
ro) Es una medida de posición de una distribución
' e) Toma valores entre O y 1, coincidiendo el O con la concentración máxima y
el 1 con la concentración mínima
' d) Ninguna de las afirmaciones es verdadera

Solución: La opción (a).

Justificación: La opción (b) es falsa porque el índice de Gini no es una medida


ce posición de una distribución sino de concentración. La opción (c) es falsa
:x:>rque el índice de Gini toma valores entre O y 1, coincidiendo el 1 con la
concentración máxima y el O con la concentración mínima. La opción (d) es
~Isa porque la opción (a) es verdadera.
66 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.4.25. En relación con el índice de Gini {IG) y la curva de Lorentz,


indique cuál de las respuestas siguientes es verdadera.

(a) Si IG = 1, la concentración es máxima


(b) IGno puede ser igual a O
(c) Si IG = 1 la curva de Lorentz es el segmento que une los puntos (0,0) y
(100, 100)
(d) Las respuestas (a) y (c) son verdaderas

Solución: La opción (a) .

Justificación: La opción (b) es falsa porque IG toma valores comprendidos


entre O y 1; toma el valor O cuando la variable está distribuida de forma muy
homogénea. La opción (c) es falsa porque si IG = 1, la concent ración es
máxi ma, toda la renta está en las manos de un individuo y la curva de Lorentz
coincidiría con el eje horizontal hasta el punto (100,0) donde saltaría al punto
( 100, 100). La opción (d) es falsa porq ue la opción (c) es falsa.

T.4.26. Indique cuál de las siguientes opciones es verdadera.

(a) Si la curva de Lorenz coincide con la línea de 45 grados que pasa por el
origen, el Índice de Gini toma el valor 1
(b) Para dibujar la curva de Lorenz, en el eje de abscisas se representa la
población ordenada de forma que los percentiles de renta más alta quedan
a la izq uierda y los de renta más baja quedan a la derecha
(c) El Índice de Gini no puede tomar el va lor O
(d) Ninguna de las respuest as es verdadera

Solución: La opción (d).

Justificación: La opción (a) es fa lsa porque si la curva de Lorenz coincide con


la línea de 45 grados que pasa por el origen, la variable estaría distribuida de
forma completamente equitativa y el Índice de Gini tomaría el valor O. La
opción (b) es falsa porque para dibujar la curva de Lorenz, en el eje de
abscisas se representa la población ordenada de forma que los percentiles de
renta más baja quedan a la izquierda y los de renta más alta quedan a la
derecha. La opción ( c) es falsa porque IGtoma valores comprendidos entre O y
1; toma el va lor O cuando la variable está distribuida de forma muy
homogénea.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUC IONES UNIDIMENSIONALES 67

T.4.27. En el caso de una distribución plenamente equitativa o justa


de la renta, se cumple:

(a) La curva de Lorenz coincide con el eje horizontal hasta el pu nto (100,0)
donde salta al punto (100,100)
(b) El va lor del índice de Gini es cero
(c) El coeficiente de variación es próximo a 1
(d) Ninguna de las anteriores

Solución: La opción (b ).

Justificación: La opción (a) es falsa porque en el caso de una distribución


plenamente eq uitativa o justa de la renta, la curva de Lorenz coincide con la
ínea de 45 grados que pasa por el origen. La opción (c) es falsa porque el
coeficiente de variación puede tomar un valor diferente de l. La opción (d) es
falsa porque la opción (b) es verdadera.

T.4.28. Cuando en una determinada población, la concentración de


renta es máxima:

(a) El índice de Gini es igual a 1


(b) La curva de Lorenz es la diagonal que va desde el punto (0,0) al
( 100,100);
(c) Las respuestas (a) y (b) son correctas
(d) Ninguna de las respuestas es correcta.

Solución: La opción (a).

Justificación: La opción (b) es falsa porque en el caso de que la concentración


sea máxima, toda la renta está en las manos de un individuo y la curva de
Lorentz coincidiría con el eje horizontal hasta el punto (100,0) donde saltaría
al punto (100,100). La opción (c) es falsa porque la respuesta (b) es falsa. La
opción (d) es falsa porque la opción (a) es verdadera.
68 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

4.2. Problemas

P.4.1. A partir de la siguiente tabla de frecuencias, indique la


respuesta falsa.

X¡ 1 2 3 4 5 6 7 8 9 10
n¡ 2 7 8 8 22 3 13 17 7 13

(a) El rango es 9
(b) El coeficiente de apertura toma el valor 10
( c) El valor de la desviación media es 2,8
(d) Las opciones (a) y (b) son verdaderas

Solución: La opción (c).

Justificación: Como se demuestra a continuación, la opción (c) es falsa porque


el valor de la desviación media es 2,2 .

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La tabla de frecuencias de la distribución es la siguiente:

X¡ n¡ N¡ X;* n ¡
1 2 2 2
2 7 9 14
3 8 17 24
4 8 25 32
5 22 47 110
6 3 so 18
7 13 63 91
8 17 80 136
9 7 87 63
10 13 100 130
SUMA= 100 SUMA= 620

1) El rango se define como la diferencia entre el mayor (10) y el menor va lor


(1) de la distribución: Rx = Xn-X 1 = 10 - 1 = 9.

2) El coeficiente de apertura es la relación entre el mayor y el menor valor de


10
la distribución: Cap, = l = 1O
-""'- ~··..........,DAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 69

= ="-=":el cálculo de la desviación media, el primer paso es calcular la media


a= 0 d istribución:
a

=- xgu ndo lugar se obtiene la columna x,-x


(quinta columna de la Tabla
_ :-:ta) y a continuación se obtiene el valor absol uto de esta columna

(sexta columna de la Tabla adjunta).

-
X¡ n; Ni Xt·*n X, - X lx,- ~ ¡x,- * ,
1 2 2 2 -5,2 5,2 10,4
2 7 9 14 -4,2 4,2 29,4
3 8 17 24 -3,2 3,2 25,6
4 8 25 32 -2,2 2,2 17,6
5 22 47 110 -1,2 1,2 26,4
6 3 so 18 -0,2 0,2 0,6
1 7 13 63 91 0,8 0,8 10,4
1 8 17 80 136 1,8 1,8 30,6
'
1 9 7 87 63 2,8 2,8 19,6
1 10 13 100 130 3,8 3,8 49,4
SUMA =1 00 SUMA =620 SUMA =220

A continuación se aplica la fórmula correspondiente:


n

D = ~lx, - xjn, = 220 =.,.,


X N 100 - ·-

P.4.2. Los siguientes datos corresponden al número de personas en


situación de desempleo en una muestra de familias. Indique la
respuesta correcta.
1
X¡ 1 2 3 4 5
1 n¡ 3 5 6 4 2

(a) El número medio de personas en desempleo es igual a 3


(b) El rango del número de personas en situación de desempleo es 3
(c) El recorrido intercuartílico es 1,5
(d) Ninguna de las demás opciones es correcta
70 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Solución: La opción (c).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


el número medio de personas en desempleo es 2,85. La opción (b) es fa lsa
porque el rango del número de personas en situación de desempleo es 4. La
opción (d) es falsa porque la opción (c) es verdadera .

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La tabla de frecuencias de la distribución es la siguiente:

X¡ n¡ N¡ X¡* n ¡
1 3 3 3
2 5 8 10
3 6 14 18
4 4 18 16
5 2 20 10
SUMA =20 SUMA =57

Para el cálculo de la media de las personas en desempleo, se aplica la fórmula


siguiente:
1=5
2, x,n,
- t= I 57 ? 85
X= - N- = 20 =-·

El rango se define como la diferencia entre el mayor (5) y el menor valor (1)
de la distribución, es decir: Rx = x5 - x 1 = 5 -1 = 4

El recorrido o Rango intercuartílico se define como la diferencia entre el tercer


y el primer cuartil de la distribución. Para obtenerlo, se procede a calcular

Existe un valor que coincide con 5 en la columna de N;, que corresponde al


valor de la variable X¡ = 2; luego el valor del primer cuartil corresponde a la
semisuma de 2 y 3.
2 3
0 1= + = 25
2 '
3·N = 60= 15
El tercer cuartil Q3 se calcula mediante la expresión :
4 4
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 71

El primer valor que lo supera en la columna de las N¡ es 18 que corresponde a


X¡ = 4; Luego Q3 = 4

A continuación se calcula el Rango intercuartílico R¡ =QrQ 1 = 4 - 2,5 = 1,5


P.4.3. A partir de los siguientes datos que corresponden al número
de personas en situación de desempleo en una muestra de familias,
indique cuál es la respuesta correcta.

1 ~ ~ ~
1 1 1 : 1 : 1 ~ 1

(a) El valor de la desviación media es aproximadamente 0,88


(b) En la mitad o más de los hogares hay 2 personas en situación de
desempleo
(c) El valor de la desviación mediana es aproximadamente 0,95
(d) Ninguna de las demás opciones es correcta

Solución: La opción (c).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


el valor de la desviación media es 0,98 . La opción (b) es falsa porque son 5 el
número de los hogares donde hay 2 personas en situación de desempleo,
luego existen 2 personas en desempleo en menos de la mitad de los hogares.
La opción (d) es falsa porque la opción (c) es verdadera .

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La tabla de frecuencias de la distribución es la siguiente:

X¡ n¡ N¡ X¡* n¡
1 3 3 3
2 5 8 10
3 6 14 18
4 4 18 16
5 2 20 10
SUMA= 20 SUMA= 57

1) Para el cálculo de la desviación media, el primer paso consiste es calcular la


media de la distribución:
72 EJERC ICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

1- 5
¿ x,n,
X=l=I- - = -57
-
= ?85

N 20

En segundo lugar se obtiene la columna x,-x


(quinta columna de la Tabla
adjunta) y a continuación se obtiene el valor absoluto de esta columna
/x¡-x 1 (sexta columna de la Tabla adjunta) .

-
X¡ n¡ N¡ X¡* n ¡ X, - X lx, - ~ X¡- Xfl,

1 3 3 3 -1,85 1,85 5,55


2 5 8 10 -0,85 0,85 4,25
3 6 14 18 0,15 0,15 0,9
4 4 18 16 1, 15 1,15 4,6
5 2 20 10 2,15 2,15 4,3
SUM A= 20 SUMA= 57 SUMA= 19,6

Finalmente, se aplica la fórmula correspondiente a la desviación media:


;
¿ ¡x,- xjn,
D- = i= I = 19,6 ""o 98
X N 20 ,

2) Para el cálculo de la desviación mediana se procede como sigue:

En primer lugar se obtiene la mediana, aplicando el criterio convencional, así


se calcula 20/2 = 10. El primer valor que lo supera en la columna N¡ es el 14;
que corresponde a X¡ = 3; la mediana es en consecuencia el valor 3.

A continuación se obtiene x, - Mé (quinta columna de la Tabla adjunta) y su


valor absoluto ¡x;- M~ (sexta columna de la Tabla adjunta).

X¡ n¡ N¡ X¡* n ¡ X, - M6 lx, - M~ x,- Men,


1 3 3 3 -2 2 6
2 5 8 10 -1 1 5
3 6 14 18 o o o
4 4 18 16 1 1 4
5 2 20 10 2 2 4
SUMA = 20 SUMA = 57 SUMA = 19
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 73

Finalmente, se aplica la fórmula correspondiente a la desviación mediana:


n
¿]x, - M~n;
oMI = '" 1
N =.!..2."'
20 o.9s

P.4.4. A partir de los siguientes datos que corresponden al número


de personas en situación de desempleo en una muestra de familias,
indique cuál es la respuesta correcta.

(a) El valor de la desviación típica es 2,28 aproximadamente


(b) El valor de la varianza es mayor que 2
(c) El valor de la desviación típica es mayor de 1,5
(d) Ninguna de las demás opciones es correcta

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


el valor de la desviación típica es aproximadamente 1,195. La opción (b) es
falsa porque el valor de la varianza es 1,428 aproximadamente. La opción (c)
es falsa porque el valor de la desviación típica es aproximadamente 1,195.

Cálculo: A continuación se describe el proceso de cálculo adoptado.

La tabla de frecuencias de la distribución es la siguiente:


- -
X¡ n¡ X¡* n¡ X,- X (X,-X) n, <x, - xf (X, - X)"n,
1 3 3 -1,85 -5,55 3,4225 10,2675
2 5 10 -0,85 -4,25 0,7225 3,6125
3 6 18 0, 15 0,9 0,0225 0,1350
4 4 16 1, 15 4,6 1,3225 5,2900
5 2 10 2,15 4,3 4,6225 9,2450
SUMA= 20 SUMA= 57 SUMA = O SUMA= 10,112 SUMA =28,55

cada columna de la tabla se ha calculado de la forma siguiente:

• En la primera y segunda columna se muestran los valores de la variable


(x¡) y frecuencias (n¡). En la tercera columna, se construye, fila a fila, el
producto x,n, necesario para obtener la media aritmética :
74 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

20

I xA
X= i~I = 57=2 85
N 20 '
• Conocida la media aritmética, en la cuarta columna se obtiene, el valor
de x, -x; para ello se ha procedido a restar a cada va lor de la variable
la media aritmética de la distribución.
• En la quinta columna se ha realizado la operación ( X¡ - x)n, 1 simplemente
20
paracomprobarquesecumple: :L<x,- x) n, =O
1-1

• En la sexta columna, siempre trabajando fila a fila, se eleva al cuadrado


el va lor de la cuarta columna, obteniéndose con ello el va lor ( X, - xf .

• Finalmente, en la séptima columna se obtiene, también fila a fila, el


valor de la expresión ( x, - x)~ n, . para ello se multiplica el valor de la
1

columna sexta por el valor de la columna segunda.

La suma de la séptima columna, dividida por 20 (N = 20), determina el valor


de la varianza.
20

I <x¡- x) 2n; 28 55
u2 = t~I 1,428 :::::--'-:::::
X N 20
La desviación típica se calcula como la raíz cuadra da positiva de la varianza:

P.4.5. Se estudia la concentración de la masa salarial en tres


empresas, cuya distribución de salarios se muestra en la tabla
siguiente. Seleccione la respuesta correcta.

Nº de Nº de Nº de
Salario Mensual
trabajadores de trabajadores de trabajadores de
en euros
la Empresa A la Empresa B la Empresa C
(500-800] 20 150 120
(800-1.200] 300 200 220
(1.200-1.600] 190 100 60
(1.600-2.000] 50 110 160

(a) La primera empresa A tiene una concentración de salarios más alta que la
segunda empresa
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 75

(b) La segunda empresa B tiene una concentración de salarios más alta que la
tercera empresa
(c) La tercera empresa C tiene una concentración de salarios más alta que la
primera empresa
(d) Ninguna de las demás opciones es correcta

Solución: La opción (c) .

Justificación: Como se demuestra a continuación, las opciones (a) y (b) son


falsas porque los índices de Gini de las empresas A, B y C son
respectivamente, 0, 1104; 0,2397 y 0,2743 aproximadamente; por lo que la
empresa C tiene un índice de Gini mayor y por tanto, una concentración de
salarios más alta que las empresas A y B y la empresa B una concentración de
salarios más alta que la empresas A. La opción (d) es falsa porque la opción
(c) es verdadera .

Cálculo: A continuación se describe el proceso de cálculo adoptado.

Se obtiene la siguiente tabla auxiliar para las empresas A y B:


-.J
(J'I

_m1:>resa A
E m
c....
(L1-1,L1] n, N¡ p1= (N¡/N)* lOO X¡ X¡ n; U¡ Q¡ p¡ - Q¡ m
:::o
()
(400-8001 20 20 3 571429 600 12.000 12.000 1 796407 1,775021 o
(800-1.2001 300 320 57 142857 1000 300.000 312.000 46 706587 10,436270 6
(/)
(1.200-1.6001 190 510 91 071429 1400 266.000 578.000 86 526946 4 544482 o
(1.600-2.000] 50 560 100 1800 90.000 668.000 100 o m
-1
n 1 ni
m
Suma N =560 ¿ p, = 151,785714 668.000 ¿ (p,- q,)= 16,755774 (/)
11 1 1 -1
-u
Empresa B )>

(L;. ¡,L¡] n, N, p;= (N¡/N)*lOO X¡ x1 n¡ U1 Q¡ p¡ - Q¡ ~


z
-1
(400-800] 150 150 26,785714 600 90000 90.000 14,331210 12 454504 :::o
(800-1.200] 200 350 62,5 1000 200000 290.000 46,178344 16,32 1656 o
- o
(1.200-1.6001 100 450 80,357143 1400 140000 430.000 68,471338 11,885805 e
()
(1.600-2.0001 110 560 100 1800 198000 628.000 100 o ()
ni n 1
-
oz
Suma N = 560 ¿ p, = 169,642857 628.000 ¿ (pi - ql)= 40,661965
1 1 1 1
)>

_m1 >resa e
E ~
m
(/)
{L¡.1,L¡] n¡ N¡ p;= (N¡/N)* lOO X¡ X¡ n¡ Q¡ p ¡ - Q¡
~

(400-8001 120 120 21 428571 600 72000 72.000 10 843373 10,585198 o


(800-1.2001 16,738382
ui
220 340 60 714286 1000 220000 292.000 43 975904 ::!
()
( 1.200-1.600] 60 400 71,428571 1400 84000 376.000 56,626506 14 802065 )>
( 1.600-2.000] 160 560 100 1800 288000 664.000 100 o o
m
n 1 ni
)>
Suma N =560 ¿ p, = 153,571429 664.000 ¿ (p,- ql)= 42, 125645 o
1 1 I 1 m
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 77

En las que:

• Se comprueba que los valores de la variable están ordenados de menor


a mayor.
• Se calculan las frecuencias acumuladas N;
• Se obtiene la columna p¡ dividiendo la columna N¡ por el valor N = 560 y
multiplicando por 100.
• Se calculan las marcas de clase (x¡) y el producto X¡ ·n;
• Se obtiene el valor de la columna U¡ de la siguiente forma:
o Para el primer intervalo (400-800] será u1 = x1n; => 600 * 20 =
12.000
o Para el 2° intervalo (800-1.200] será u2 = u 1 + x2 n2 => 12.000 +
(1.000•300) = 312.000
o Etc.
• Se obtiene la columna q¡ dividiendo la columna U¡ por el valor la suma de
la columna X¡'n¡ y multiplicando por 100.
• Finalmente se obtiene la columna p¡-q¡, cuyo sumatorio constituye el
numerador del cociente que da lugar al índice de Gini y que para las 3
empresas queda:
n-1

°L(P;- q,)
I GA = _,;_1- -- 16 ' 75 5 77 4 "' o1 104
n-1
151.7857 14 '
LP;
n-1
¿ (p,- q,) -
/G = ¡'; 1 = 40,66196'.>"' 2397
0
B n-l 169642857 '
¿ p, '
/; I

42 , 125645 "'0.2743
153,571429

P.4.6. La distribución de empleados en una empresa se muestra en el


cuadro adjunto. Indique cuál es la contestación verdadera.

Niveles de salarios(€) Número de empleados


500 - 1.500 230
1.500 - 2.500 160
2.500 - 3.500 80
3.500 - 4.500 30
78 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

(a) El índice de Gini de la distribución de salarios es mayor que 0,10 y


menor que 0,35
(b) El índice de Gini de la distribución de salarios es mayor que 0,35 y
menor que 0,50
(c) El índice de Gini de la distribución de salarios es mayor que 0,50 y
menor que 0,70
(d) Ninguna de las anteriores

Solución: La opción (a) .

Justificación: La opciones (b) y (c) son falsas porque el índice de Gini de la


distribución de salarios es aproximadamente 0,21. La opción (d) es falsa
porque la opción (a) es verdadera.

Cálculo: A continuación se muestra el proceso de cá lculo del Índice de Gini.

• Se comprueba que los valores de la variable están ordenados de menor


a mayor.
• Se calculan las marcas de clase (x ¡)
• Se calculan las frecuencias acumuladas N¡
• Se obtiene la columna p¡ dividiendo la columna N¡ por el va lor N = 400, y
multiplicando por 100.
• Se obtiene el sumatorio (sin considerar el último p¡) de los p¡ que será el
numerador del cociente que da lugar al Índice de Gini.
• Se calcula el producto x ¡ ·n¡
• Se obtiene el valor de la columna U¡ que corresponde a los x ¡ ·n,.
acumulados
• Se obtiene la columna q¡ dividiendo la columna U¡ por el valor la suma de
la columna x;·n¡ y multiplicando por 100.
• Finalmente se obtiene la columna p¡-q;, cuyo sumatorio (sin el último
término) constituye el numerador del cociente que da lugar al Índice de
Gini.
n-1
¿ (pi - ql)
IG = i-1 n-1

L P1
1- 1

Los resultados se muestran en la tabla adjunta.


LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 79


Marca
Nº de acumulado Total de
de
clase
empleados de salarios p, =L.; x, n, p, = ~ 100 Q, = ~ 100
Jln
p ¡ - Q¡
n, empleados n,·x,
X,
N,
1.000 230 230 230.000 230.000 46 25,27 20,73
2.000 160 390 320.000 550.000 78 60,44 17,56
3.000 80 470 240.000 790.000 94 86,81 7, 19
4.000 30 500 120.000 910.000 100 100 o
n-1 11-1

N =500 P n = 910.000
¿_ p,= L (P;- Q,)
I 1 l• I

218 = 45,47
n- 1

"¿) P, - Q, ) 45 47
/ = /~ I =-'-:::::0 2 1
218 '
G
¿p,
n 1

I 1

P.4.7. La distribución de los salarios de los empleados en una


empresa se muestra en el cuadro adjunto. Se reduce la plantilla en
SO empleados pertenecientes al estrato de salarios 1.500-2.500 € .
Indique cuál es la opción verdadera.

Niveles de salarios (€) Número de de empleados


500 - 1.500 290
1.500 - 2.500 170
2.500 - 3.500 30
3.500 - 4.500 10

(a) Después de la reducción de plantilla, la curva de Lorentz se ha acercado a


la línea de 45 grados que pasa por el origen
(b) Después de la reducción de plantilla, el índice de Gini ha au mentado en
aproximadamente 0,24
(c) Antes de la reducción de plantilla, el índice de Gini de la distribución de
salarios es mayor que 0,22 y menor que 0,35
(d) Ninguna de las anteriores es verdadera

Solución: La opción (d).

Justificación: La opción (a) es falsa porque el Índice de Gini, después de la


reducción de plantilla, aumenta desde 0,13 a 0,14 y por tanto crece el grado
de concentración de la distribución de salarios y la curva de Lorentz se separa
80 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

de la línea de 45 grados que pasa por el origen . La opción (b) es falsa porque
después de la reducción de plantilla, el índice de Gini ha aumentado en
aproximadamente 0,01. La opción (c) es falsa porque antes de la reducción de
plantilla, el índice de Gini de la distribución de salarios es menor que 0,22.

Cálculo: A continuación se muestran los cálculos realizados para calcular los


índices de Gini de ambas distribuciones.

Antes del despido de 50 empleados del estrato 1500-2500 euros:

Marca Nº Total
Nº de
de acumulado de de
empleados j11 = ¿ x, n, p = ~ 1 00 Q, = ~ 1 00 p,. - q,.
clase empleados salarios ' N jln
n,
X, N, n,·x,
1.000 290 290 290.000 290.000 58 38,16 19,84
2.000 170 460 340.000 630.000 92 82,89 9,11
3.000 30 490 90.000 720.000 98 94,74 3,26
4.000 10 500 40.000 760 .000 100 100 o
n-1 n 1
jln = 760.0 PQ ¿ p, L ( P, - q,)
N = 500 H l=I

= 248 = 32,21
n- 1

I = ~(P,- Q,} = 32,2 1 ::: 01 3


G n 1 24 8 .
¿p,
,_,
Después del despido de 50 empleados del estrato 1500-2500 euros:


Marca
Nº de acumulado Total de
de
empleados de salarios ji,= ¿ x, n, p, = ~ 100 Q, =..&wo p,. - q,.
clase jl n
n, empleados n,·X,
X,
N,
1.000 290 290 290.000 290.000 64,44 43,94 20,51
2.000 120 410 240.000 530.000 91,11 80,30 10,81
3.000 30 440 90.000 620.000 97,78 93,94 3,84
4.000 10 450 40.000 660.000 100 100 o
n-1
¿ p, n- 1

L(P, - Q¡)
N = 450 jl 0 = 660.000 t- 1
/=)
=
= 35,15
253,33
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 81

n 1

I = ~( P,- Q, ) = 35. 15 ""


253 33 0 , 14
G
¿p,
n-I
,
/:::.)

P.4.8. En la tabla adjunta se muestran, por estratos de menor a


mayor, los porcentajes acumulados de población (p¡) y de la renta
(u¡) sin acumular, respectivamente, de dos países A y B. Indique la
opción falsa.

9¡ U¡

PAIS A PAÍS B
20 3,23 5,34
40 7,04 9,75
60 12,15 14,23
80 20,75 21,02
100 56,83 49,66

(a) El índice de Gini del país B es mayor que 0,35 y menor que 0,65
(b) La diferencia entre los índices de Gini de ambos países es menor que 0,3
(en valor absoluto)
(c) La distribución de la renta del país A es menos equitativa, es decir, más
concentrada que la del país B
(d) La curva de Lorentz del país A está más próxima a la línea de 45 grados
que pasa por el origen que la curva de Lorentz del país B

Solución: La opción (d).

Justificación: La opción (d) es falsa porque los Índices de Gini de los pa íses A
y B son respectivamente 0,60 y. 0,50 y por tanto la distribución de la renta del
país A es menos equitativa, o más concentrada, que la del país B, y la curva
de Lorentz del país A está menos próxima a la línea de 45 grados que pasa
por el origen que la curva de Lorentz del país B.

Cálculo: A continuación se muestran los cálculos realizados para calcular los


índices de Gini de ambos países.

En el cuadro adjunto se muestran los resultados intermedios necesarios para


poder aplicar la fórmula del índice de Gini:
82 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE A DE

n-1

L) P1- Q; )
/ -~'=~I_ __
G - n-1

L P;
i=I
En la que p; y q; son los porcentajes acumulados de población y de renta,
respectivamente, por estratos de menor a mayor.

µ, Q, = _Jl,_100
Q, =_Jl,_100
1/, Pn p ¡ - Q¡ µ. Pi,- Q;
PAÍS p¡ í
PAÍS A í PAÍS A PAIS B
B PAÍS B
PAÍS A
3,23 5,34 20 3,23 16,77 5,34 14,66
7,04 9,75 40 10,27 29,73 15,09 24,91
12,15 14,23 60 22,42 37,58 29,32 30,68
20,75 21,02 80 43,17 36,83 50,34 29,66
56,83 49,66 100 100 o 100 o
fl-1 fl-1 n-1

,L P = 200 , L (P, - q, ) = 120,9 L (P, - q, ) = 99,91


i= I l=I i=I

Por tanto, el índice de Gini del país A es:

n- 1

2:J P,- Q,)


/ = = 120,91 ,,,, 060
f,_, P;
l =I

G 200 .

Asimismo, el índice de Gini del país B es:


n-1

'L,<P, - q, )
/G = -'-'-'=~I n-,-- 99,9 1 ,,,,050
200 ,
L, p,
11

A partir de los resultados obtenidos, cabe concluir que al ser el IG del país A
mayor que el del país B, la distribución de la renta es menos equitativa o más
concentrada en el país A que en el país B.

P.4.9. En la siguiente tabla se presentan los niveles de salarios de los


empleados de una empresa. Debido a la caída en la demanda de sus
productos, son despedidos 30 empleados de cada uno de los dos
grupos de mayor renta. Indique la respuesta verdadera.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 83

Niveles de renta (€) Cantidad de empleados


500 - 1000 50
1000 - 1500 100
1500 - 2000 200
2000 - 2500 100
2500 - 3000 50

(a) El coeficiente de Gini después del despido de los 60 empleados es


aproximadamente 0,35
(b) El coeficiente de Gini antes del despido es aproximadamente 0,46
(c) El coeficiente de Gini aumenta después del despido de los 60 empleados
(d) Ninguna de las opciones anteriores es verdadera

Solución: La opción (d) .

Justificació rr. La opción (a) es falsa porque el Índice de Gini de la distribución


de salarios, después de la reducción de plantilla, es 0,14. La opción (b) es
falsa porque el Índice de Gini de la distribución de salarios, antes de la
reducción de plantilla, es 0,17. La opción (c) es falsa porque el Índice de Gini
de la distribución de salarios, después de la reducción de plantilla, disminuye
desde 0,17 a 0,14.

Cálculo: A continuación se muestran los cálculos realizados para calcular los


índices de Gini de ambas distribuciones.

Antes del despido de los 60 empleados:


Marca
Nº de acumulado Total de
de
clase
empleados de salarios µ, = ¿ x, n, p = ~ 100 q =~ 100
Jln
p ¡ - Q¡
n, empleados n,·x,
X,
N,
750 50 50 37.500 37.500 10 4,29 5,71
1.250 100 150 125.000 162.500 30 18,57 11,43
1.750 200 350 350.000 512 .500 70 58,57 11,43
2.250 100 450 225.000 737 .500 90 84,29 5,71
2.750 50 500 137.500 875 .000 100 100 o
n-J 11-I

µ n = 875.000
l, P, L (P,- q,)
N =500 l=l 1·1

= 200 = 34, 29
84 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

ni

L )P, - q,) 34 29
'ª = ,_, n 1
= _200
.- ~ 0.17
L P1
'1

Después del despido de los 60 empleados:


Marca
Nº de acumulado Total de
de
empleados de salarios p , =¿ x, n, p, = ~ 100 q, =~ 100 p¡ - q¡
clase fi n
n, empleados n·x
x, 1 '

N,

750 50 50 37.500 37.500 11,36 5,17 6,19


1.250 100 150 125.000 162.500 34,09 22,41 11,68
1.750 200 350 350.000 512.500 79,55 70,69 8,86
2.250 70 420 157.500 670.000 95,45 92,41 3,04
2.750 20 440 55.000 725.000 100 100 o
n- 1
¿ p, n-1

I <P,- Q,)
1-1
N = 440 Jln = 725.000 l=I
=
= 29,76
220,45
n-1

L (p,- q, ) 29.76
f - i =I = --"='0 ) 4
n 1 220.45 '
G -
¿p,
,_,

P.4.10. En la siguiente tabla se presentan los niveles de renta de los


empleados de una empresa. Debido a la caída en la demanda de sus
productos, son despedidos 80 empleados del grupo de mayor salario
y otros 80 del grupo de menor salario. Indique cuál de las opciones
siguientes es verdadera.

Número de t rabajadores
Salario Mensual en euros
de la Empresa
(500-1000] 150
(1000-1500] 50
(1500-2000] 35
(2000-2500] 165
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 85

(a) El coeficiente de Gini aumenta después del despido de los 160 empleados
(b) La distribución de salarios es menos concentrada o más equitativamente
distribuida después del despido de los 160 empleados
(c) El coeficiente de Gini después del despido de los 160 empleados es
aproximadamente 0,63
(d) Las opciones (b) y (c) son correctas

Solución: La opción (b).

Justificación: La opción (a) es falsa porque el Índice de Gini de la distribución


de salarios, después del despido de los 160 empleados, disminuye desde 0,41
a 0,35. La opción (c) es falsa porque el Índice de Gini de la distribución de
sa larios, después de la reducción de plantilla, es aproximadamente 0,35. La
opción (d) es falsa porque la opción (c) es falsa.

Cálculo: A continuación se muestran los cálculos realizados para calcular los


índices de Gini de ambas distribuciones.

Antes del despido de los 160 empleados:

!Marca Nº
Nº de acumulado Total de
de
clase
empleados de salarios p, = ¿ x1 n, p, = ~ 100 Q, =~ 100
fi n
p¡ - q¡
n, empleados ni' x,
x,
N,

1 750 150 150 112.500 290.000 37,50 18,52 18,98


1.250 50 200 62 .500 630.000 50,00 28,81 21,19
11.750 35 235 61.250 720.000 58,75 38,89 19,86
2.250 165 400 371.250 760.000 100 100 o
1 n- 1
¿p, n-1

L (P,- q,)
1-1
N = 400 Pn = 607.500 l= I
=
= 60,04
146,25

n-1
L CP1- q¡)
I G -_ --'--'--
l= I
n-- 1 - -
60,04 ::::: o 41
146,25 '
L P;
i=I
86 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Después del despido de los 160 empleados:


Marca
Nº de acumulado Total de
de N
empleados de salarios p , = ¿ x, n, p =- 100 q =..t'_IOO p¡ - q¡
clase ' N Pn
n, empleados fl¡ X,
X,
N,

750 70 150 52.500 52.500 29,17 14,29 14,88


1.250 so 200 62.500 115.000 50,00 31,29 18,71
1.750 35 235 61.250 176.250 64,58 47,96 16,62
2.250 85 400 191.250 367.500 100 100 o
n- 1
n 1
LP,
f=I L (P, - Q,)
N = 240 Pn = 367.500 t=I
=
= 50)1
143,75

ni

2JP, - Q, )
jG = t= I n 1 50,2 1 ::::: 0.35
143 ,75
L_ p,
l=I

P.4.11. De una distribución de frecuencias, se conoce que la varianza


es 12, y el momento central de orden 4 vale 72. Indique cuál es la
opción verdadera.
(a) La distribución es platicúrtica
(b) La distribución es mesocúrtica
(c) La distribución es leptocúrtica
(d) No se puede decir nada de la distribución

Solución: La opción (a).

Justificación: Como se demuestra a continuación, las opciones (b) y (c) son


falsas porque el coeficiente de curtosis es negativo (g 2 = -2.5) y por ta nto la
distribución es platicúrtica o menos apuntada que la Normal. La opción (d) es
falsa porque la opción (a) es verdadera.

Cálculo: La expresión que define el coeficiente de curtosis es la siguiente:


m4 72
g, = - - 3 = - - 3= - 2,5
- (T~ 144
Por lo tanto, el coeficiente de curtosis es negativo (g 2 = -2.5) y la distribución
es platicúrtica.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCION ES UNIDIMENSIONALES 87

P.4.12. De una distribución de frecuencias, se conoce que la varianza


es 49, y el momento central de orden 3 es 230. Atendiendo al
coeficiente de asimetría de Fisher, indique cuál es la opción
verdadera.

(a) La distribución es simétrica


(b) La distribución es asimétrica a la izquierda
(c) La distribución es asimétrica a la derecha
(d) La distribución puede ser simétrica

Solución: La opción (c) .

Justificación: Como se demuestra a continuación, las opciones (a), (b) y (d)


son falsas porque el coeficiente de asimetría de Fisher es positivo {g 1 = 0,67)
y por tanto, la distribución es asimétrica a la derecha.

Cálculo: El coeficiente de asimetría de Fisher está basado en el momento de


tercer orden y se obtiene con la siguiente expresión:

m3 230
gl = -3 = - ~0,67 > 0
a 343

Al ser el coeficiente de asimetría de Fisher positivo (g 1 = 0,67), la distribución


es asimétrica a la derecha.

P.4.13. Dada la siguiente tabla de frecuencias, indique la respuesta


correcta .

1 ~ ~ ~ ~ 1
1 1 1 1 1 : 1

(a) El rango es 4 y la media es 3


(b) El coeficiente de apertura toma el valor 5 y la mediana es 3,5
(c) El valor del recorrido intercuartílico es de 2,2
(d) Ninguna de las anteriores es correcta

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


el rango es 4 y la media es 3,2. La opción (b) es falsa porque el coeficiente de
apertura toma el valor 5 y la mediana es 2,5. La opción (c) es falsa porque el
valor del recorrido intercuartílico es de 1,25.
88 EJ ERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE

Cálculo: A continuación se describe el proceso de cálculo adoptado.


La tabla de frecuencias de la distribución es la siguiente:

X¡ n¡ N¡ X¡* n ¡
1 3 3 3
2 7 10 14
3 1 11 3
4 1 12 4
5 8 20 40
SUMA= 20 SUMA= 64

El rango se define como la diferencia entre el mayor (10) y el menor valor (1)
de la distribución. Es decir, Rx = Xn-X 1 = 5 -1 = 4
l=-fl

¿ x,
La media se define mediante la expresión siguiente: x= -'-N1
- =
64
20
=12

El coeficiente de apertura se define como la relación entre el mayor y el menor


valor de la distribución. Es decir, c.p• = ~1 =s

Para el cálculo de fa mediana se comprueba si existe un N; igual a N/2 y se


procede calculando fa media aritmética de X1 y del siguiente X¡+1; Es decir,
2
M = + 3 = 25
e 2 '

El recorrido intercuartílico toma el siguiente valor: RRx = Hx = ~ = 1,25


X' 3,2

P.4.14. I ndique cuál es la opción correcta sobre la siguiente


distribución de frecuencias relativa a las notas de los alumnos de una
clase.

nota o 1 2 3 4 5 6 7 8 9 10
alumnos 1 3 o 6 4 11 2 8 7 5 3

(a) La media toma el valor 5


( b) La desviación típica es 4, 2
(c) El coeficiente de variación toma el valor 0, 72
( d) Ninguna de las anteriores es correcta

Solución: La opción (d) .


LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 89

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


la media toma el valor 5,82. La opción (b) es falsa porque la desviación típica
es aproximadamente 2,5274. La opción (c) es falsa porque el valor del
coeficiente de variación es aproximadamente 0,4343.

Cálculo: A conti nuación se describe el proceso de cálculo adoptado.

La tabla de frecuencias de la distribución es la siguiente:

2.
X¡ n¡ N¡ X¡* n¡ X¡ n¡
o 1 1 o o
1 3 4 3 3
2 o 4 o o
3 6 10 18 54
4 4 14 16 64
5 11 25 55 275
6 2 27 12 72
7 8 35 56 392
8 7 42 56 448
9 5 47 45 405
10 3 50 30 300
Suma =:50 Suma= 291 Suma =:2013

r-n
- ¿ x, 291
La media se define como X = - 1 -1 - =- = 5,82
N 50

2
~~
3 2
El valor de la desviación típica es : a x= -5,8 2 :::::: 2,52 74

ax 2,52 74 O
El coeficiente de variación es: Cv =-=- = ? :::::: ,43 4 3
X 5,8_

P.4.15. Se ha realizado un mismo examen en dos grupos distintos.


En el primero la nota media obtenida fue de 6,3 y una desviación
típica de 1, 2. En el segundo grupo la nota media ha sido 8 con una
desviación típica de 3 . lEn qué clase han sido los datos más
variables?
90 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

(a) La primera clase es más variable


(b) La segunda clase es más variable
( c) Las dos clases son igual de variables
(d) Con los datos que se conocen no se puede conocer cuál es la clase
más variable.

Solución: La opción (b).

Justificación: Como se demuestra a continuación, las opciones (a), (c) y (d)


son falsas porque el coeficiente de variación de la segunda clase (0,375) es
mayor que el coeficiente de variación de la primera clase (0,19) y por lo tanto,
la segunda clase es más variable que la primera.

Cálculo: A continuación se describe el proceso de cálculo adoptado.

Para la primera clase: eV= ¿~


'
.
100 = O,19

Para la segunda clase: CV=2·100 = 0,375


8
DISTRIBU CIONES BIDIMENSIONALES . REGRESIÓN Y CORRELACIÓN 91

CAPÍTULO 5. DISTRIBUCIONES DE FRECUENCIAS


BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN

5.1. Preguntas Teóricas

T.5.1. En relación con las variables nacionalidad y edad, indique la


respuesta correcta .

(a) Son dos variables cualitativas.


(b) La variable naciona lidad es cualitativa y edad es una variable cuantitativa.
(c) La variable edad es cualitativa y nacionalidad es una variable cuantitativa.
(d) Las dos variables son cuantitativas.

Solución: La opción (b).

Justificación: Las opciones (a), (c) y (d) son falsas porque la variable
nacionalidad es una variable cualitativa y edad es una variable cuantitativa.

T.5.2. Se desea estudiar la distribución conjunta de frecuencias de


las variables marca y color del coche. Indique la respuesta correcta .

(a) Las dos variables son cuantitativas y a su tabla de frecuencias se le


denomina tabla de Correlación
(b) Las dos variables son cualitativas y a su tabla de frecuencias se le
denomina tabla de Correlación
(c) Las dos variables son cuantitativas y a su tabla de frecuencias se le
denomina tabla de Contingencia
(d) Las dos variables son cualitativas y a su tabla de frecuencias se le
denomina tabla de Contingencia

Solución: La opción (d).

Justificación: Las opciones (a), (b) y (c) son falsas porque las dos variables
son cualitativas y a su tabla de frecuencias se les denomina tabla de
Contingencia, no tabla de Correlación.

T.5.3. Indique la respuesta correcta correspondiente a la siguiente


distribución bidimensional de frecuencias sobre el sexo y el estado
civil de 425 personas.
92 EJERCICIOS DE TEST PARA INTRODU CCIÓN A LA ESTADÍSTICA DE ADE

Gráfico de frecuencias bidimensionales 225


250
200
200

150

'IJO
50
O l---l';:m._....L...,r-->'!.,_...J.......,.-""'.3...._J.......,-__..,11::='--.-~"---'-,-..--'---1.~.a3----'----,

e o
.e:: 8 8 .!9
8 8 ]§
~ .~
(J

o <Z.>
.e::
/g i!! ~ E
oE::
11) 11)

"' .g (J f}
'6
~

·~
fE
"' • varan
/J. o rrujer

(a) Existe un mayor número de mujeres divorciadas que casadas


(b) Hay más hombres viudos que mujeres viudas
( c) Hay más mujeres casadas que hombres solteros
(d) Se evaluó el estado civil en menos varones que mujeres

Solución: La opción (c).

Justificación: La respuesta (a) es falsa ya que hay 50 mujeres divorciadas y 66


casadas. La respuesta (b) es falsa ya que hay 10 varones viudos y 15 mujeres
viudas. En total se evaluó el estado civil en 225 varones y 200 mujeres, por lo
que la opción (d) es falsa.

T.5.4. Indique la respuesta falsa.

(a) La Teoría de la Correlación, determina si existe una cierta vanac1on


conjunta entre dos variables y refleja numéricamente dicha dependencia.
(b) Los tres tipos de dependencia que refleja la teoría de la Correlación son
Independencia funcional, Dependencia funcional y Dependencia aleatoria
(c) Los tres tipos de dependencia que refleja la teoría de la Correlación son
Independencia funcional, Dependencia funcional y Correlación nula
(d) Existe correlación funcional si existe una función tal que todos los valores
de la variable la satisfacen (a cada valor de X le corresponde uno solo de Y
o a la inversa)

Solución: La opción (c).

Justificación: La opción (c) es falsa porque los tres tipos de dependencia que
refleja la teoría de la Correlación son Independencia funcional, Dependencia
funcional y Dependencia aleatoria .
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN 93

T.5.5. Indique la respuesta verdadera.

(a) La Teoría de la regresión, estudia el signo y la intensidad de la


dependencia entre las distintas variables
(b) La Teoría de la correlación se encarga del estudio de las funciones que
relacionan las variables
(c) Ninguna de las demás es correcta
(d) La Teoría de la correlación estudia el signo y la intensidad de la
dependencia entre las distintas variables

Solución: La opción (d).

Justificación: La opción (a) es fa lsa porque la Teoría de la regresión, se


encarga del estudio de las funciones que relacionan las varia bles. La opción
(b) es falsa porque la Teoría de la correlación estudia el signo y la intensidad
de la dependencia entre las distintas variables. La opción (e) es falsa porque la
opción (d) es verdadera .

T.5.6. Indique la respuesta falsa.

(a) Todos los modelos econométricos incluyen una variable adicional, que
trata de recoger el efecto conjunto de múltiples variables irrelevantes o
escasamente releva ntes y que se denomina "perturbación aleatoria"
(b) Los modelos que incluyen una perturbación aleatoria" se denominan
estocásticos
(c) El principal objetivo de las relaciones entre las variables es la explicación y
en su caso la predicción de una variable, que llamaremos variable
independiente, con otra u otras variables, las variables dependientes
(d) Al estudiar una relación entre variables, es importante la especificación
previa de un modelo teórico que recoja las principales relaciones de
causalidad

Solución: La opción (c) .

Justificación: La opción (c) es falsa porque el principa l objetivo de las


relaciones entre las variables es la explicación y en su caso la predicción de
una variable, que llamaremos variable dependiente con otra u otras variables,
las variables independ ientes.
94 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T 5 .7. Indique la respuesta falsa.

(a) Cuando rxy =O no existe ninguna relación cuadrática entre las variables
(b) Cuando rxy =O no existe ninguna relación de tipo lineal entre las variables
=
(c) Si r xy 1 la relación es positiva o directa
( d) El coeficiente de correlación toma valores entre - 1 y 1 ambos inclusive

Solución: La opción (a).

Justificación: La opción (a) es falsa porque cuando rxy = O no existe relación


lineal, pero puede existir una relación cuadrática.

T.5.8. De una distribución bidimensional (X,Y) se sabe que la


covarianza es negativa y que el coeficiente de determinación (R 2 ) es
0,9. Indique la respuesta verdadera .

(a) El coeficiente de correlación no se puede calcular


(b) El coeficiente de determinación R2 indica una nula representatividad de la
recta de regresión al ser mayor de 0,85
(c) El coeficiente de correlación es aproximadament e 0,949
(d) El coeficiente de determinación R2 indica que la recta de regresión es
representativa al ser mayor de 0,85

Solución: La opción (d).

Justificación: Las opciones (a) y (c) son falsas debido a que el coeficiente de
correlación es igual a -0,949, al ser el coeficiente de correlación igual a la raíz
cuadrada del coeficiente de determinación y ser negativo porque la covarianza
es negativa. La opción (b) es fa lsa porque el coeficiente de determ inación R2
indica que la recta de regresión es representativa al ser mayor de 0,85.

T.5.9. En el caso de que exista una relación lineal perfecta entre dos
variables, se cumple que:

(a) La covarianza es cero


( b) El coeficiente de correlación es 1 o -1
(c) El coeficiente de determinación es nulo
(d) Ninguna de las anteriores es correcta

Solución: La opción (b).


DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN 95

Justificación: Las opciones (a) y (c) son falsas porque cuando existe una
relación lineal perfecta entre dos variables, el coeficiente de correlación toma
los valores 1 o -1 y la covarianza y el coeficiente de determinación no pueden
ser cero. La opción (d) es falsa porque la opción (b) es verdadera.

T.5.10. En relación con el estudio de la dependencia entre variables,


indique la respuesta correcta.

(a) Cuando las variables son cualitativas, una medida de la asociación o


correlación entre ellas viene dada por el Coeficiente de Correlación Lineal
de Pearson, cuyo valor está siempre comprendido entre -1 y + 1
(b) Cuando se trata de variables cualitativas el mejor método de Ajuste son los
Mínimos Cuadrados.
(c) Se denomina coeficiente de determinación R2 al grado de participación de
la varianza explicada en la varianza total de la variable observada.
(d) Ninguna de las anteriores es correcta

Solución: La opción (c).

Justificación: Las opciones (a) y (b) son falsas porque si las variables son
cualitativas no tiene sentido ca lcular el coeficiente de correlación lineal de
Pearson ni aplicar el método de mínimos cuadrados. La opción (d) es falsa
porque la opción (c) es verdadera .

T.S.11. El Coeficiente de Correlación Lineal de Pearson siempre


tomará valores entre:

(a) [-1, 1]
(b) [0,1]
(c) [-1,1)
(d) (-1, 1)

Solución: La opción (a).

Justificación: Las opciones (b), (c) y (d) son falsas porque el coeficiente de
correlación lineal toma valores entre -1 y 1, ambos inclusive.
96 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.5.12. En relación con las rectas de ajuste de Y sobre X y de X sobre


Y, indique la respuesta falsa.

(a) Coinciden sólo en el caso en el que el coeficiente de correlación lineal r sea


igual a 1 o a -1
(b) Son siempre perpendiculares
(c) Coinciden si las variables X e Y son incorrelacionadas
(d) Pueden coincidir

Solución: La opción (b).

Justificación: La opción (b) es falsa porque las rectas de ajuste de Y sobre X y


de X sobre Y aunque pueden ser perpendiculares, no siempre es así.

T.5.13. Indique la respuesta falsa.

(a) El coeficiente de correlación en valor absoluto es siempre menor que 1


(b) Si el coeficiente de correlación lineal es cero no hay relación lineal entre
las variables
(c) Si las variables dependiente e independiente se intercambian, el coeficiente
de correlación lineal no varía
(d) Los cambios de escala no afectan al coeficiente de correlación lineal

Solución: La opción (a)

Justificación: La opción (a) es falsa porque el valor absoluto del coeficiente de


correlación puede ser 1.

T.S. 14. Dada la regresión lineal simple Y/X, el coeficiente de


regresión b indica:

a) La variación que se produce en Y ante una variación de X en una unidad


b) Los resultados del ajuste
c) El grado de asociación lineal entre X e Y
d) La variación que se produce en X ante una variación de Y en una unidad

Solución: La opción (a).

Justificación: Las opciones (b), (c) y (d) son falsas porque en la regresión
lineal simple Y/ X, el coeficiente de regresión b indica la variación que se
produce en Y ante una variación de X en una unidad.
DISTRIBUCION ES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN 97

T.S.15. Si la varianza residual es O, indique la respuesta verdadera.

(a) La varianza de la variable dependiente es menor que la varianza explicada


por la regresión
(b) La varianza de la va riable dependiente es mayor que la varianza explicada
por la regresión
(c) La va rianza de la variable dependiente es igual a la varianza explicada por
la regresión
(d) Ninguna de las otras respuestas.

Solucíón: La opción ( c).

Justíficacíón: Las opciones (a), (b) y (d) son falsas porque si la varianza
residual es O, la varianza de la variable dependiente es igual a la varianza
explicada por la regresión.

T.5.16. Si el coeficiente de regresión bes negativo:

(a) La recta de regresión es creciente


(b) La bondad del ajuste es buena, es decir, R2 = 1
(c) La recta de regresión es decreciente
(d) Ninguna de las respuestas es correcta

Solución: La opción (c).

Justificación: Las opciones (a) y (b) son falsas porque si el coeficiente de


regresión b es negativo, la recta de regresión es decreciente, al ser su
pendiente (igual a b) negativa . La opción (d) es falsa porque la opción (c) es
verdadera.

T.S.17. Si a las variables estad ísticas X e Y las sometemos a un


cambio de origen y de escala, indique la opción verdadera:

(a) Su covarianza queda afectada por el cambio de escala


(b) Su covarianza queda afectada por ambos cambios
(e) Su covarianza queda afectada por el cambio de origen
(d) Su covarianza no queda afectada por ninguno de los cambios

Solución: La opción (c).

Justificación: Las opciones (a ), (b) y (d.) son falsas porque la covarianza solo
viene afectada por los cambios de origen, pero no por los cambios de escala.
98 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.5.18. La covarianza entre dos variables estadísticas muestra:

(a) El grado de relación lineal entre las variables


(b) El grado de compatibilidad entre las variables
( c) Si es nula, que no hay relación estadística entre las variables
(d) Ninguna de las anteriores es cierta

Solución: La opción (a).

Justificación: La opción (b) es falsa porque la covarianza entre dos variables


estadísticas muestra el grado de relación lineal entre las variables. La opción
(c) es falsa porque si es nula, puede haber relación estadística entre las
variables. La opción (d) es falsa porque la opción (a) es verdadera.

T.5.19 . La covarianza es:

(a) Una medida adimensional del grado de relación cuadrática entre dos
variables estadísticas.
(b) El momento centrado en las medias m 11 de orden l.
(c) Igual a cero cuando no existe relación alguna entre las variables.
(d) Ninguna de las anteriores es verdadera

Solución: La opción (b ).

Justificación: La opción (a) es falsa porque la covarianza entre dos variables


estadísticas muestra el grado de relación lineal entre las variables. La opción
(c) es falsa porque si es igual a cero, puede haber relación estadística entre
las variables. La opción (d) es falsa porque la opción (b) es verdadera.

T.5.20. En una regresión lineal se ha obtenido y = 2x + 8,


calculándose el coeficiente R2 = - 1,3. Indique la respuesta verdadera .

(a) El modelo explica el 20 % de la variabilidad de "y"


(b) La covarianza es positiva
( c) La correlación entre X e Y es negativa
(d) El resultado es absurdo

Solución: La opción (d) .

Justificación: La opción (a) es falsa porque a


modelo no explica el 20 % de la
variabilidad de "Y". La opción (b) es falsa porque la covarianza no es positiva.
La opción (c) es falsa porque la correlación entre X e Y no es negativa. La
respuesta correcta es la (d), porque el valor de R2 no puede ser negativo, ni
en valor absoluto ser mayor que cero.
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN 99

T.5.21. De una distribución bidimensional {X, Y) se sabe que la


varianza de la variable Y {S\) es 850 y que el coeficiente de
determinación {R2 ) es 0,9. Indique la respuesta verdadera .

(a) La varianza residual de la regresión de Y sobre X es 85


(b) La varianza residua l de la regresión de Y sobre X es 105
(c) El coeficiente de correlación lineal es 0,3
(d) Con los datos disponibles no puede calcularse ninguna varianza residual

Solución: La opción (a) .

Justificación: La opción (b) es falsa porque como se muestra a continuación, la


va rianza residual de la regresión de Y sobre X es 85. La opción ( c) es falsa
porq ue el coeficiente de determinación es el cuadrado de coeficiente de
correlación lineal, por lo que este no puede ser 0,3, cuyo cuadrado es 0,09. La
opción (d) es falsa porque la varianza residual de la regresión de Y sobre X es
85.

Cálculo: Para obtener la varianza residual se realiza el cálculo siguiente :

' 52 52 '
R - = J - _e2 ::::::> Ü 9 = 1- _ e ::::::> 5- = 85
5 ,. ' 850 e

T.5.22. Indique la opción falsa.

(a) La Odds Ratio es una medida de asociación y su valor no puede ser menor
que cero al ser un cociente de probabilidades
(b) El coeficiente de contingencia C es una medida del grado de asociación
entre dos variables cuantitativas
(c) El estadístico x2 toma valores mayores o iguales a cero
(d) Las tablas de contingencia se utilizan para estudiar la asociación entre
variables cualitativas

Solución: La opción (b).

Justificao6n: La opción (b) es falsa porque el coeficiente de cont ingencia Ces


una medida del grado de asociación entre dos conjuntos de atributos.
100 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.5.23. Entre dos variables X e Y no tiene sentido aplicar la técnica de


regresión si:

(a) La relación entre ellas no es lineal


(b) Las variables no muestran causalidad entre sí
(c) Las variables no se miden en las mismas unidades
(d) Ninguna de las anteriores

Solución: La opción (b ).

Justificación: Las opciones (a) y (c) son falsas porque no tiene sentido aplicar
la técnica de regresión si las variables no muestran causalidad entre sí. La
opción (d) es falsa porque la opción (b) es verdadera.
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
101

5.2. Problemas

P.5.1. A partir de los datos siguientes sobre dos variables x e y que


toman 6 valores (N = 6), indique cuál es la opción verdadera.
6 6 6 6 6
L, x,= 36 L, y,= 42 L, x,y,= 800 L, r,= 1206 L, Y,= 1260
J:::s l J: J 1-1 1=-1 /:I

(a) La recta de regresión de Y sobre X es aproximadamente y = 3,68 + 0,55x


(b) m 11 es menor de 90
(c) El coeficiente de determinación es aproximadamente 0,61
(d) Ninguna de las respuestas anteriores es verdadera

Solución: La opción (a).

Justificación: Como se demuestra a continuación, la opción (b) es falsa porque


m11 es 91,333 aproximadamente. La opción (c) es falsa porque el coeficiente
de determinación es aproximadamente 0,31. La opción (d) es falsa porque la
opción (a) es verdadera .

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

~ Y; 42
ªº· = -6- = -6= 7
6
¿1,
_..!=!...___ 1260_2 10
ª 02 - 6 - 6 -
6

L X;Y; 800
ª••= i=•
6
= - :::: 133,333
6
m11 = a 11 - a 10a 01 = 133,333-6-7:::::9 1,333

m20 = a20 - a 120 = 20 1- 6 2 = 165 m02 = a02 - a~ 1 = 2 1O- 7 2 = 161

Los parámetros de la recta de regresión son los siguientes:

b = mi' = 91,333 ~ 0,55


m20 165
a=a01 - ba10 ~ 7 - 0,55 ® 6 ~ 3,68
Por lo tanto, la recta de regresión es aproximadamente y = 3,68 + 0,55 x
102 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

La expresión del coeficiente de determinación es la siguiente :

P.5.2. A partir de los datos siguientes sobre dos variables x e y que


toman 6 valores (N = 6), indique cuál es la opción verdadera.

6 6 6 6 6
¿ x, = 36 ¿ y,= 42 ¿ x,y1 =800 ¿ x¡ = 1206 ¿ y¡= 1260
i=I i=I i=I i=I i=I

(a) La varianza de la variable Y toma el valor 161


(b) La varianza residual de la regresión toma el valor 51,2
( c) La varianza de la variable Y toma el valor 44
(d) Ninguna de las respuestas anteriores es verdadera

Solución: La opción (a).

Justificación: Como se demuestra a continuación, la opción (b) es falsa porque


la varianza residual de la regresión es 50,56 aproximadamente. La opción (c)
es falsa porque la varianza de la variable Y es 161. La opción (d) es falsa
porque la opción (a) es verdadera.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

6 6
¿ x, LY; 42
36
a,o= --
6
=-=
i=I

6
6 ªº' =.E..!__=
6
-6 = 7
6
¿ y¡
_ k!...__ - 1260 - 2 1o
ª 02 - 6 - 6 -
6

~ X¡J, 800
a,1 = - - = - "'133,333 m11 = a11 - a10 a01 = 133,333-6 · 7 ""9 1,333
6 6
a~0 = 2 01 - 6 = 165
2
m20 = a20 - m02 = a02 - a~, = 21O-7 2 = 161

La varianza de la variable Y viene dada por la expresión siguiente:

S~ a~ 1
2
= a02 - = 2 1O- 7 = 161
La expresión de la varianza explicada por la regresión es:
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
103

52 = m0
m2 = 16 i X 9 1333
_ ll '
2
::::; J J Ü44
1
ry - m 20 165 ,

Finalmente la varianza residual, definida como la diferencia de las dos


anteriores, toma el siguiente valor:
,. S'; - S,y::::;
S.V= 2
J6 1- l I 0,44::::;50,56

P.5.3. A partir de \os datos siguientes sobre dos variables x e y que


toman 6 valores (N =
6), indique cuál es la opción verdadera.

6 6 6 6 6
_L x;=36 _L y1 =42 _Lx;Y1 =800 _L i,1= 12 06 _L .0= 1260
i= I i= I i=I i= I

(a) El coeficiente de determinación no se puede calcular


(b) El coeficiente de determinación toma el valor 0,76
(c) El coeficiente de determinación es aproximadamente 0,31
(d) Ninguna de las respuestas anteriores es verdadera

Solución: La opción (c).

Justificación: Como se demuestra a continuación, las opciones (a) y (b) son


falsas porque el coeficiente de determinación es 0,31 aproximadamente. La
opción (d) es falsa porque la opción (c) es verdadera.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.
6 6

¿ x; LY; 42
;.¡ 36 6 ª 01 =...!::!....___=-= 7
ª1 0= - - = - =
6 6 6 6
6
¿ ¡,
-~- 1 260_210
ª
02 - 6 - 6 -
6

f;x,y, 800 ,
a 11 =- - =- "' 133,333 m11 =a11 - a10 a01 = 133,333- 6 · 7 "'91,33_,
6 6
2
m20 = a 20 - a;0 = 20 1-6 2 = 165 m02 = a02 - a¿1 =2 10-7 =16 1

La expresión del coeficiente de determinación es la siguiente:


104 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

P.5.4. Seleccione la respuesta correcta relativa a la siguiente tabla


bidimensional de frecuencias referidas a salarios y años de
antigüedad en la empresa, de 100 trabajadores de una empresa.

~d
s
m
1 2 3 4 5 Total

e ( )
500-1.000 8 6 14 6 4 38
1. 000-1. 500 3 6 2 11 5 27
1.500-2.000 4 2 8 2 7 23
2.000-2.500 o o 2 4 6 12
Total 15 14 26 23 22 100

(a) La media de los salarios de los 100 trabajadores es mayor q ue 1500€, y la


desviación típica es mayor de 500
(b) La media de los salarios de los 100 trabajadores es menor que 1000€, y la
desviación típica es mayor de 500
(c) La media de los años de antigüedad de los 100 trabajadores es mayor que
4, y la desviación típica es mayor que 3
(d) La media de los sa larios de los 100 trabajadores es mayor que 1000€, y la
desviación típica es menor de 600

Solución: La opción (d).

Justificación: Como se demuestra a continuación, las opciones (a) y (b) son


falsas porque la media de los salarios de los 100 trabajadores es 1.295€, y la
desviación típica es aproximadamente 520,07. La opción (c) es fa lsa porque la
media de los años de antigüedad de los 100 trabajadores es 3,23, y la
desviación típica es aproximadamente 1,34.

Cálculo: A continuación se describe el proceso de cálcu lo de las cuestiones


planteadas.

Para la obtención de las medidas de posición y dispersión de las distribuciones


margina les se construyen en primer lugar las t ablas de frecuencias asociadas a
cada variable y luego se calculan las medidas requeridas.

Para la variable salarios se obtiene la siguiente tabla auxiliar:


DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
105

2
(L¡. 1,L¡] (n¡) m¡ =X¡ (n¡)*X¡ X, - X (X; - X)2 (X; - X) n,
500-1.000 38 750 28.500 -545 297.025 11286.950
1.000- -45 2.025 54.675
27 1.250 33.750
1.500
1.500- 207.025 4761.575
23 1.750 40.250 455
2.000
2.000- 912.025 10.944.300
12 2.250 27.000 955
2.500
Total 100 129.500 27.047.500

A partir de los resultados mostrados en la tabla, se obtiene el valor de la


media de la variable salarios:
100
¿ xn 1 1
x=..!=!...___ = 129500 =1295€
N 100

La suma de la séptima columna de la tabla anterior, dividida por 100 (N =


100), determina el va lor de la varianza de la variable salarios.

100 -
1
¿ (x, - X) n,
(J' 1 = 1-1 = 27047500 = 270475
X N 100

La desviación típica de la variable salarios se calcula como la raíz cuadrada


positiva de la varianza :
sx = .J270475-:::::. 520.072 11

Análogamente, para la variable años de antigüedad se obtiene la siguiente


tabla de frecuencias.

Años -
(n¡) m¡ = Z¡ (n¡)*Z¡ z,- z (z, - z)1 (Z1 - Z) 1 n,
Antigüedad
1 15 1 15 -2,23 4,97 74,59
2 14 2 28 -1,23 1,51 21 ,18
3 26 3 78 -0,23 0,05 1,38
4 23 4 92 0,77 0,59 13,64
5 22 5 110 1,77 3,13 68,92
Total 100 323 179,71

A partir de los resultados mostrados en la tabla, se obtiene el valor de la


edia de la variable años de antigüedad:
106 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

100
_ ¿z¡n¡
Z= i=I =3 23= 323
N 100 '

La suma de la séptima columna de la tabla anterior, dividida por 100 (N =


100), determina el valor de la varianza de la variable años de antigüedad.
100
¿ cz¡- Z) 2 n¡
0' 2 = i=I ~ 1 79 , 71 ~ 1 79 7 1
z N lOO '

La desviación típica de la variable años de antigüedad se calcula como la raíz


cuadrada positiva de la varianza:

sz = J1 ' 7971 ~ 1,3406

P.S.S. A partir de la siguiente tabla bidimensional de frecuencias


referidas a salarios y años de antigüedad en la empresa, de 100
trabajadores de una empresa, indique la respuesta correcta.

Años de antigüedad

Salarios 1 2 3 4 5 Total
mensuales en
euros(€)
500-1.000 8 6 14 6 4 38
1.000-1.500 3 6 2 11 5 27
1.500-2.000 4 2 8 2 7 23
2.000-2.500 o o 2 4 6 12
Total 15 14 26 23 22 100

(a) La covarianza es positiva lo que indica que a medida que aumenta la


antigüedad de los trabajadores aumenta su salario
(b) La covarianza es negativa lo que indica que a medida que aumenta la
antigüedad de los trabajadores aumenta su salario
(c) La covarianza es positiva lo que indica que a medida que aumenta la
antigüedad de los trabajadores disminuye su salario
(d) La covarianza es negativa lo que indica que a medida que aumenta la
antigüedad de los trabajadores disminuye su salario

Solución: La opción (a).


DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
107

Justificación: Como se demuestra a continuación, las opciones (b), (c) y (d)


son falsas porque la covarianza es positiva lo que indica que a medida que
aumenta la antigüedad de los trabajadores aumenta su salario .

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

La variable X corresponde con el salario de los trabajadores. Su tabla de


frecuencias es la siguiente:

-
(L¡. 1,L¡] (n¡) m¡ =X¡ (n¡)* X¡ X, - X
500-1.000 38 750 28.500 -545
1.000-1.500 27 1.250 33.750 -45
1.500-2.000 23 1.750 40.250 455
2.000-2.500 12 2.250 27.000 955
Total 100 129.500

La variable Z corresponde con la antigüedad en la empresa. Su tabla de


frecuencias es la siguiente :

Años -
(ní) m¡ = Z¡ (ni)* zi z,- z
Antigüedad
1 15 1 15 -2,23
2 14 2 28 -1,23
3 26 3 78 -0,23
4 23 4 92 0,77
5 22 5 110 1,77
Total 100 323

Con estos datos se puede formar la siguiente tabla auxiliar, que nos permite
obtener los resultados buscados.
108 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

- -
X,- X zk - z nik (X,- X) (z, - Z)n,1
Para (x = 750; z = 1) -545 -2,23 8 9722,8
Para (x = 750; z = 2) -545 -1 ,23 6 4022,1
Para (x = 750; z = 3) -545 -0,23 14 1754,9
Para (x = 750; z = 4) -545 0,77 6 -2517,9
Para (x = 750; z = 5) -545 1,77 4 -3858,6
Para (x = 1.250; z = 1) -45 -2,23 3 301,05
Para (x = 1.250; z = 2) -45 -1,23 6 332,1
Para (x = 1.250; z = 3) -45 -0,23 2 20,7
Para (x = 1.250; z = 4) -45 0,77 11 -381, 15
Para (x = 1.250; z = 5) -45 1,77 5 -398,25
Para (x = 1.750; z = 1) 455 -2,23 4 -4058,6
Para (x = 1.750; z = 2) 455 -1,23 2 -1119,3
Para (x = 1.750; z = 3) 455 -0,23 8 -837,2
Para (x = 1.750; z = 4) 455 0,77 2 700,7
Para (x = 1.750; z = 5) 455 1,77 7 5637,45
Para (x = 1.750; z = 1) 955 -2,23 o o
Para (x = 2.250; z = 2) 955 -1,23 o o
Para (x = 2.250; z = 3) 955 -0,23 2 -439,3
Para (x = 2.250; z = 4) 955 0,77 4 2941,4
Para (x = 2.250; z = 5) 955 1,77 6 10142,1
Total / Suma 21965

Aplicando la expresión de la covarianza, se obtiene:

Co 1f x z) =
f :tn,lx; - xXzk- z)= -
1 1
~ k- i
2 1965
- = 219 65
V\ ' N 100 '

Este valor significa que existe una relación positiva entre los salarios (X) y los
años de antigüedad (Z), indicándonos que, estadísticamente, a medida que
aumenta la antigüedad de los trabajadores aumenta su sa lario.

P.5.6. Una empresa ha comprobado experimentalmente que sus


ventas (en miles de euros por semana) están relacionadas con el
número de trabajadores disponibles para atender a la clientela,
disponiendo de los datos que se muestran en la tabla siguiente.
Indique la respuesta falsa.
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
109

Número de trabajadores Ventas


(X¡) (Y¡)
5 20
6 25
7 29
8 33

(a) El número medio de trabajadores es aproximadamente 6,5


(b) El número medio de ventas es aproxi madamente 26,75
(c) La recta de regresión es aproximadamente: y= -1,2 - 3,4 x
(d) La covarianza es aproximadamente 179,25

Solución: La opción (c) .

Justificación: Como se demuestra a continuación, la opción (e) es falsa porque


la recta de regresión es aproximadamente y= -1,2 + 4,3x.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas .

En primer lugar, se construye la tabla auxiliar siguiente, donde se muestran


las sumas necesarias.

1 X¡ y¡ X¡ y¡ X¡2 y¡2
1 5 20 100 25 400
1 6 25 150 36 625
1 7 29 203 49 841
8 33 264 64 1089
Suma= 26 Suma= 107 Suma = 717 Suma = 174 Suma = 2955

A partir de la tabla anterior, se calculan los momentos respecto al origen y a la


media:
X = a10 ::::: 6,5

Sxy = m11 ::::: 179 ,2 5 s; = m 20 ::::: 43 ,5 s;= mo2::::: 23,1875


Los parámetros de la recta de regresión son los siguientes:
m11
b= - ::::: 4,3
m 20

a= a 01
- ba 10
::::; -1 ,2
110 EJERCIC IOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE

Por lo tanto, la recta de regresión es: y = -1,2 + 4,3x

P.5.7. En la tabla siguiente se muestra la distribución de las variables


X e Y. Indique la opción verdadera.

Período X¡ y¡
Semana 1 32 200
Semana 2 25 420
Semana 3 23 380
Semana 4 21 300
Semana 5 18 170

(a) Aproximadamente m 02 = 9504; m 11 = 545,60


(b) La recta ajustada y/x es aproximadamente y = 125,94 + 5,99 x
( c) La recta ajustada y/x no es representativa ya que el coeficiente de
determinación correspondiente (R2) es inferior a 0,2
(d) Ninguna de las respuestas es verdadera

Solución: La opción ( c).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


aproximadamente m02 = 9504; m 11 = 2,8. La opción (b) es fa lsa porque la
recta aj ustada y/x es aproximadamente y = 290,99 + 0,13 x. La opción (d) es
falsa porque la opción (c) es verdadera.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

En primer lugar se construye la tabla auxiliar siguiente, donde se muestran las


sumas necesarias.

X¡ y¡ x2 y2 X.y
32 200 1024 40.000 6.400
25 420 625 176.400 10.500
23 380 529 144.400 8.740
21 300 441 90.000 6.300
18 170 324 28.900 3.060
Suma= 119 Suma =1.470 Suma = 2.943 Suma = 479.700 Suma = 35.000

A partir de la tabla anterior, se calculan los momentos respecto al origen y a la


media:
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
11 1

X= a10 =23,8

Asimismo, se calcula la recta de regresión de y sobre x:


b= m'' =O l3
m 20 '

a= a0 1 - ba,0 = 290,99

Es decir, la recta de regresión es aproximadamente: y= 290,99+ 0,13x

Finalmente, la Bondad del Ajuste viene dada por el Coeficiente de


Determinación R2 :

P.5.8. En la tabla siguiente se muestra el número de bacterias por


unidad de volumen, presentes en un cultivo después de un cierto
número de horas. Indique la respuesta correcta.

X: Nº de horas o 1 2 3 5
Y: Nº de bacterias 12 24 35 66 14

(a) La media del número de horas es 2,5 y la media del número de bacterias
es 33
(b) El valor de la covarianza es menor de 5
(c) La recta ajustada y/x es representativa ya que el coeficiente de
determinación correspondiente (R2) es cercano a 1
(d) Ninguna de las respuestas es verdadera

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


aproximadamente la media del número de horas es 2,2 y la media del n° de
bacterias es 30,2. La opción (b) es falsa porque el valor de la covarianza es
aproximadamente 5,96. La opción (c) es falsa porque la recta ajustada y/x no
es representativa ya que el coeficiente de determinación correspondiente (R 2)
es aproximadamente 0,031 que no es próximo a 1.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.
112 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

En primer lugar se construye la tabla auxilia r siguiente, donde se muestran las


sumas necesarias.

X¡ y¡ x2 y2 x.y
o 12 o 144 o
1 24 1 576 24
2 35 4 1.225 70
3 66 9 4.356 198
5 14 25 196 70
11 151 39, 6.497 362

A continuación se calcu lan los momentos respecto al origen y a la media:

X= a10 = 2,20 Ji = a0 , = 30,2 a20 = 7,8 a02 = 1299,4 a11 = 72,4


2
m20 = a 20 -(a 10 ) = 2,96 m02 = a 02 -(a 01 )2 = 387,36 m 11 = a, 1 - a,0a01 = 5,96

Asimismo, la Bondad del Ajuste viene dada por el Coeficiente de


Determinación R2:
,
R2 = m¡1 :::: 0.03 1
m2o * m<n

P.5.9. En la tabla siguiente se muestra el número de bacterias por


unidad de volumen, presentes en un cultivo después de un cierto
número de horas. Indique la respuesta correcta.

X: Nº de horas o 1 2 3 5
Y: Nº de bacterias 12 24 35 66 14

(a) El número medio de bacterias pasadas 8 horas es aproximadamente 43,57


(b) El número medio de bacterias pasadas 10 horas es aproximadamente
45,87
( c) El número medio de bacterias pasadas 11 horas es aproximadamente
49,87
(d) El nú mero medio de bacterias pasadas 12 horas es aproximadamente
51,85

Solución: La opción (b).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


aproximadamente el número de medio de bacterias pasadas 8 horas es 41 ,85.
..,

DISTRIBUCIONES BIDIMENSIONALE S. REGRESIÓN Y CORRELACI ÓN


• 113
\"
~
1 La opción (c) es fa lsa porque el núm ero medio de bacterias pasadas 11 horas
1 es aproximadamente 47,88. La opció n (d) es falsa porque el número medio de
bacterias pasadas 12 horas es aproxi madamente 49,89.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

En primer lugar, se calcula la rectad e regresión:


1
b = m 11 : : < 2,01
m lO

a = ª 0 1 - ba10 ~ 25,77

Por lo que la recta de regresión es ap roximadamente: y = 25,77+ 2,0lx


A continuación se realizan las predicciones correspondientes, que se muestran
en la tabla siguiente. Por ejemplo, para x = 9; y = 25, 77+ 2,01 · 9 = 43,86
aproximadamente.

X y
8 41,85
9 43,86
10 45,87
11 47,88
12 49,89

P.5.10. En la tabla siguiente se muestra la distribución de las


variables x e y. Indique la opción verdadera .

Variable X Variable Y
20 200
25 420
24 380
21 300
18 170

(a) Aproximadamente m02 = 9.504; m 11 = 545,60


(b) La recta ajustada y/x es aproximadamente y = 125,94 + 5,99 x
( c) La recta ajustada y/x no es representativa ya que el coeficiente de
determinación correspondiente (R2) es inferior a 0,2
(d) Ninguna de las respuestas es verdadera
114 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


aproximadamente m02 = 9.504; m 11 = 245,60. La opción (b) es falsa porque la
recta ajustada y/x es aproximadamente y = -504,94 + 36,988x. La opción (c)
es falsa porque la recta ajustada y/x es representativa ya que el coeficiente de
determinación correspondiente (R 2) es aproximadamente 0,956.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

En primer lugar se obtienen los sumatorios necesarios para el cálculo de los


momentos, que se muestran en la tabla auxiliar siguiente .

X¡ y¡ X¡2 X¡ y¡ y¡2
20 200 400 4000 40000
25 420 625 10500 176400
24 380 576 9120 144400
21 300 441 6300 90000
18 170 324 3060 28900
1 Suma Total 108 1.470 2366 32980 479700

A partir de los resultados anteriores, calculamos los diferentes momentos de


primer y segundo orden que se muestran a continuación.

Momentos respecto al origen Momentos respecto al origen


de primer orden: de segundo orden:
5 <

Variable X ¿ x,
a = ...!::.!___
10 5
108
= - = 21 ,60 = X
5
a20 = ~x,'
5
= 2·366 = 473 ,2 0
5
5 5

Variable Y LY1
a = -='-----
1.470
= -5- = 294 = y a ,= ~~ = 479.700 = 95.940
01 5 º- 5 5
Momento ~ 5
Producto
3 =
I I X,Y ¡ 32 980
= - ·- = 6.596
respecto al 11
/• I l=I
5 5
origen
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
115

Momentos respecto a la media de segundo orden :

Variable X
s,; = m20 = a 20 -
, ,
a¡0 = 4 73,20-21.60' = 6,64

Variable Y 52
y= mo2 =ª02- ª 012 =95 .940-2942 = 9.5o4

Momento Producto
respecto a la Sxy = m11 = a11 - a10 a01 = 6.596- 2 1,60· 294= 245 ,60
media

Finalmente, obtenemos los coeficientes de la recta de regresión y =a + bx,


aplicando las relaciones siguientes:

b = m1i = 245 ,60 ::::: 36,988


m20 6,64
a= a 01 -b a,0 :::::: -504 ,94

En resumen, la recta de regresión adopta la expresión: y = -504,94 + 36,988x

El coeficiente de determinación valdría :

R2 = W¡, = 24 5,6d ~ 0, 956


m02 · m20 9.504·6,64

El va lor obtenido para el coeficiente de determinación nos sugiere que la recta


de regresión tiene un alto poder predictivo.

P.5.11. Una empresa quiere realizar un estudio sobre la influencia del


gasto en I+D+i sobre sus ventas. A partir de los siguientes datos,
indique la opción verdadera.

Gasto (x¡) Ventas (y¡)


Años (millones de (millones de
euros) euros)
2009 10 130
2010 25 155
2011 40 175
2012 50 210
116 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

(a) Aproximadamente m 20 = 139,69; mu = 254,38.


(b) La recta ajustada y/x es aproximadamente y= -115,26 +1,891 x
(c) La recta ajustada y/x es representativa ya que el coeficiente de
determinación correspondiente (R 2) es superior a 0,85.
(d) Ninguna de las respuestas es verdadera.

Solución: La opción (c).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


aproximadamente m 20 = 229,6875; mu = 434,3750. La opción (b) es falsa
porque la recta ajustada y/x es aproximadamente y = 108,40 + l,891x. La
opción (d) es falsa porque la opción (c) es verdadera .

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

En primer lugar se obtienen los sumatorios necesarios para el cálculo de los


momentos, que se muestran en la tabla auxiliar siguiente.

X¡ y¡ X¡2 X¡ y¡ y¡2
10 130 100 1300 16900
25 155 625 3875 24025
40 175 1600 7000 30625
so 210 2500 10500 44100
1 Suma Total 125 670 4825 22675 115650

A partir de los resultados anteriores, calculamos los valores aproximados de


los diferentes momentos de primer y segundo orden que se muestran a
continuación.

ª 10 31,2500
ª 01 167,5000
ª 20 1206,2500
ª 02 28912,5000
ª 11 5668,7500
m11 = a11 - a1oao1 434,3750
m20 = a20 - a10a10 229,6875
mo2 = ao2 - ao1ao1 856,2500

A continuación, obtenemos los coeficientes de la recta de regresión y=a+bx,


que son, aproximadamente:
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
117

b = mu/m20 = 1,891156
a = ao1 - b*a 10 = 108,401361

En resumen, la recta de regresión de y/x adopta aproximadamente la


expresión: y= 108,40 + 1,891x

Finalmente, el coeficiente de determinación valdría:

R2 = m~1 434,3750 ,,, o,959


m02 · m20 856,25- 229 ,6875

El valor obtenido para el coeficiente de determinación nos sugiere que la recta


de regresión tiene un alto poder predictivo.

P.5.12. En la tabla siguiente se muestra la distribución de las


variables x e y. Indique la opción falsa.

X y
19 120
20 116
30 110
33 101
38 100

(a) El Coeficiente de correlación es aproximadamente -0,96 por lo que se


deduce que hay una buena correlación negativa.
(b) El Coeficiente de determinación R2 es aproximadamente 0,93 por lo que
existe un aceptable ajuste lineal entre las varia bles.
(c) Aproximadamente m20 = 54,8; m 11 = -56,6
(d) La recta de regresión de x/y es aproximadamente x= 126,224+ 0,598y

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (d) es falsa porque


la recta ajustada x/y es aproximadamente x = 126,224 - 0,898y.

Cálculo: Describimos el proceso de cálculo de las cuestiones planteadas.

En primer lugar se obtienen los sumatorios necesarios para el cálculo de los


momentos, que se muestran en la tabla auxiliar siguiente.
118 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

X¡ y¡ X¡2 X¡ y¡ y¡2
19 120 361 2280 14400
20 116 400 2320 13456
30 110 900 3300 12100
33 101 1089 3333 10201
38 100 1444 3800 10000
1 Suma Total 140 547 4194 15033 60157

A partir de los resultados anteriores, calculamos los valores aproximados de


los diferentes momentos de primer y segundo orden que se muestran a
continuación .

ª 10 28
ª 01 109,4
ª 20 838,8
ª 02 12031,4
au 3006,6
mu = au - a1oao1 -56,6
m2o = a20 - a10a10 54,8
mo2 = ao2 - ao1ao1 63,04

A continuación, obtenemos los coeficientes de la recta de regresión x =a +


by, que son, aproximadamente:

b = mll/m 02 = -0,897843
a = a10 - b* a01 = 126,223985

En resumen, la recta de regresión de x/y adopta aproximadamente la


expresión : x = 126,224- 0,898y

El coeficiente de correlación se obtiene mediante la siguiente expresión:


r -- m1 1
-- -56,6 - o 963
--
Jm02 -Jm20 J 63,04 )54,8 '

Finalmente, el coeficiente de determinación es el cuadrado del coeficiente de


correlación, por lo que valdría aproximadamente:
J

R2 = m¡I ~ .0,9632 ~ 0,927


mo2 · m 20
El valor obtenido para el coeficiente de determinación nos sugiere que la recta
de regresión tiene un aceptable poder predictivo.
DISTRIBUCION ES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
119

P.5.13. A partir de los siguientes datos sobre el número de


trabajadores y las ventas mensuales de un establecimiento
comercial, ajuste una función exponencial del t ipo y = abx, e indique
cuál es la opción verdadera. (Operar con EXCEL o con al menos seis
decimales en calculadora)

Número de Ventas en miles de


trabajadores (x¡) euros (y¡)
4 70
7 85
9 90
12 95
13 100

(a) El coeficiente " a" es negativo y el coeficiente "b " es positivo.


(b) El coeficiente "a " es mayor que 40 y el coeficiente "b " es mayor que 2
(c) El coeficiente "a " es mayor que 30 y el coeficiente "b " es mayor que 0,5
(d) Las opciones (a) y (c) son correctas

Solución: La opción (c).

Justificación: Como se demuestra a continuación, las opciones ( a) y (b ) son


fa lsas porque el coeficiente "a " es aproximadamente igual a 63,07 y el
coeficiente "b" es aproximadamente igual a 1,037. La opción (d) es falsa
porque la opción (a) es falsa .

Cálculo: A continuación se describe el proceso de cá lcu lo de las cuestiones


planteadas.

En primer lugar la función exponencial se convierte en una función lineal


tomando logaritmos neperianos en los dos miembros de la ecuación
exponencial y = a + bx. La nueva ecuación lineal es: In (y) = In (a) + In (b) x
que la expresamos en la forma Y = A+BX donde Y = In (y); X = x; B = In (b);
A = In (a).

A continuación se opera como en la regresión linea l, obteniendo los


sumatorios que se muestran en la tabla auxiliar siguiente.
120 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

X¡= X¡ y¡ Y¡ = ley x? X¡ Y¡ y¡2


4 70 4,248495 16 16,993981 18,049712
7 85 4,442651 49 31,098559 19,737150
9 90 4,499810 81 40,498287 20,248287
12 95 4,553877 144 54,646523 20,737795
13 100 4,605170 169 59,867212 21,207592
1 Suma Total 41 440 22,350003 459 203,104562 99,980536

Las magnitudes aproximadas de los momentos necesarios para calcu lar la


recta de regresión se muestran en la tabla adjunta.

a10 9
ao1 4,470001
ª 20 91,8
ao2 19,996107
ª 11 40,620912
mu = au - a1oao1 0,390907
m2o = a20 - a1oa10 10,8
mo2 = ao2 - ao1ao1 0,015201

Los coeficientes de la regresión lineal son, aproximadamente:

B = mu /m20 = 0,036195
A = ao1 - b* a 10 = 4,144245

Asimismo, los coeficientes de la regresión exponencial (y = a + bxJ son,


aproximada mente:

a = antilogaritmo de A (a = eA) = 62,0113


b = anti logaritmo de B (b = e 8 ) = 1,0311

Con lo que la expresión analítica de la función exponencial ajustada será,


aproximadamente: y = 63,07 · 1,03r

P.5.14 A partir de los siguientes datos sobre el número de


trabajadores y las ventas mensuales de un establecimiento
comercial, ajuste una función potencial del tipo y =
axb, e indique
cuál es la opción verdadera .
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
121

Número de Ventas en miles de


trabajadores (x¡) euros (y¡)
4 70
7 85
9 90
12 95
13 100

(a) El coeficiente "a"es negativo y el coeficiente "b"es positivo.


(b) El coeficiente " a " es aproximadamente igual a 47,55 y el coeficiente "b " es
aproximadamente 1,762
(c) El coeficiente "a"es menor que 35 y el coeficiente " b" es mayor que 0,5
(d) Ning una de las opciones anteriores es verdadera

Solución: La opción (d).

Justificación: Como se demuestra a continuación, las opciones (a), (b) y (c)


son falsas porque el coeficiente "a" es aproximadamente igual a 47,55 y el
coeficiente "b"es aproximadamente igual a 3,862.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

En primer lugar, la función potencial se convierte en una función lineal


tomando logaritmos neperianos en los dos miembros de la ecuación potencial
y = axb. La nueva ecuación lineal es: In (y) = In (a) + b · In (x) que la
expresamos en la forma Y = A+BX donde Y = In (y); X = In (x); B = b; A = In
(a).

A continuación se opera como en la regresión lineal, obteniendo los


sumatorios que se muestran en la tabla auxiliar siguiente.

X¡ = X¡ y¡ X; = In x; Y¡ = In y¡ x? X; Y; Y;2
4 70 1,386294 4,248495 1,921812 5,889665 18,049712
7 85 1,945910 4,442651 3,786566 8,645000 19,737150
9 90 2,197225 4,499810 4,827796 9,887092 20,248287
12 95 2,484907 4,553877 6,174761 11,315959 20,737795
13 100 2,564949 4,605170 6,578965 11,812028 21,207592
Suma
41 440 10,579285 22,350003 23,289900 47, 549745 99,980536
1
Total
122 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Las magnitudes aproximadas de los momentos que son necesarios para


calcular la recta de regresión se muestran en la tabla adjunta.

a 10 2,115857
ao1 4,470001
a20 4,657980
ª 02 19,996107
au 9,509949
mu = au - a10ao1 0,052067
m20 = a20 - a10a10 0,181129
mo2 = ao2 - ao1ao1 0,015201

Los coeficientes de la regresión lineal son, aproximadamente:

B = m11/m 20 = 0,287456
A= ao1 - b* a10 = 3,861784

Los coeficientes de la regresión potencial son, aproximadamente:

a = antilogaritmo de A (a=eA) = 47,550116


b = B = 3,861784
Con lo que la expresión analítica de la función potencial ajustada será,
aproximadamente: y 47,55 · x 3,862
=
P.5.15. A partir de los datos que se muestran en la tabla adjunta, se
quiere estudiar si existe relación entre ser zurdo o diestro y el sexo.
Indique la respuesta verdadera.

Diestro Zurdo Total


Hombre 10 2 12
Mujer 20 8 28
Total 30 10 40

(a) El valor del estadístico x2


(chi cuadrado) es 2
(b) La Odds ratio toma el valor de 2,5
(c) El coeficiente de contingencia toma el valor de 0,55
(d) Todas las anteriores son falsas

Solución: La opción ( d).


DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
123

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


el va lor del estadístico x2 (chi cuadrado) es 0,635 aproximadamente. La opción
(b) es falsa porque la Odds ratio toma el valor de 3. La opción (c) es falsa
porque el coeficiente de contingencia toma el valor de 0, 125
aproximadamente.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

El estadístico x2 se calcula del siguiente modo:


x1 = f±(o, 1~E,if
1=1 ¡..1 1/

Siendo:
• r el número de filas
• k el número de columnas
• Oij (frecuencia observada) el número de casos observados clasificados
en la fila i de la columna j
• Eij (frecuencia esperada) el número de casos esperados, en el supuesto
de independencia, correspondientes a la fila i de la columna j

Se define la frecuencia esperada como aquella frecuencia que se daría si los


sucesos fueran independientes, es decir, hombres y mujeres manifestarían
idénticas opiniones. Para calcular la frecuencia esperada o teórica de cada
casilla (EiJ), se multiplican los dos totales marginales (fila y columna) y se
divide este producto por el número total de casos.

Para el cálculo del valor de la x2 se calculan en primer lugar las frecuencias


esperadas :

_01.U. 1 _ 12•30 _
E11 9
º·· 40
- ----

El, º1·º·2 12 * 1o = 3
= =
- º- 40
_u .u. _28 •3o _ 21
E º- - 40 -
21 -
2 1

E,, = U1. U.2 = 28• 10 = 7


-- º- 40

El valor de x2 es, por tanto:

x- L,L, 1
, = ~~ (0, - E,J1 =
(10 - 9}2 (2 - 3)2 (20 - 21 )2 (8-7)2
+--+ + -- :::;0635
' l• l /=1 E,¡ 9 3 21 7 '
124 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

La Odds Ratio se define como el cociente de las siguientes probabilidades:

El coeficiente de contingencia C toma el valor:

C=~ X ( + n o:0, 125

P.5.16. Para estudiar si existe relación entre fumar y el sexo se


dispone de los datos que se muestran en la tabla siguiente. Indique
la opción verdadera.

Fumar No fumar Total


Hombre 12 6 18
Mujer 22 8 30
Total 34 14 48

(a) El valor del estadístico x2 (chi cuadrado) es menor de 5


(b) La Odds ratio toma el valor de 1,4 aproximadamente
(c) El coeficiente de contingencia toma el valor de 0,65 aproximadamente
(d) Todas las anteriores son falsas

Solución: La opción (a).

Justificación: Como se demuestra a continuación, la opción (b) es falsa porque


la Odds ratio toma el valor de 0,727 aproximadamente . La opción (c) es falsa
porque el coeficiente de contingencia toma el valor de 0,071
aproximadamente . La opción (d) es falsa porque la opción ( a) es verdadera .

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

El estadístico x2 se calcula del siguiente modo:

Siendo:
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
125

• rel número de filas


• k el número de col umnas
• O;¡· (frecuencia observada) el número de casos observados clasificados
en la fila i de la columna j
• Eti (frecuencia esperada) el número de casos esperados, en el supuesto
de independencia, correspondientes a la fi la i de la columna j.

Para el cálculo del valor de ,/ se calculan en primer lugar las frecuencias


esperadas:
E = 0 1. U.1 = 18* 34= 12 75
11 º"
48 '
_ 0 . 0. _ 18* 14 __
E12 - 1 2 º" -
48 - ) ,
25

E =U2. U.1 =3 0*34 = 21 25


21 º" 48 '
E = 0 2. U.2 = 3 O* 14 = 8 7 5
22
º" 48 '

El valor de x2 es, por ta nto:


x 2 =f±(o,1 - E,}- 2
=(12 - 12,75)2 +(6 - 5.25) +(22-21.25)2 +(8-8.75)
2
"' º·242
i=i¡-i E;¡ 12.75 5.25 21,25 8.75

La Odds Ratio se define como el cociente de las siguientes probabilidades :

El coeficiente de contingencia C toma el valor:

C=g; ~ 001 1
1

x-> + n '

P.S.17. Indique la respuesta falsa en relación con la siguiente tabla


de frecuencias de dos variables asociadas (x,y}.
126 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Yi X¡
30 200
40 258
78 244
68 231
88 209
22 215
10 113

(a) La media de la variable xes aproximadamente 210


(b) La media de la variable yes aproximadamente 48
( c) La covarianza es aproximadamente 575,25
( d) Las opciones (a) y (b) son verdaderas

Solución: La opción ( c).

Justificación: Como se demuestra a continuación, la opción (c) es falsa porque


la covarianza es aproximadamente 678,8571.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas

La media de la variable aleatoria X toma el valor 210:


/;7

¿ x,
a10 = -X=/;-¡ - =14-70= 2 10
N 7

La media de la variable aleatoria Y toma el valor 48:

f;7

-
L Y1
¡;¡ 336 48
ª º'= Y=---¡¡--- =- 7- =

La covarianza toma aproximadamente el valor 678,8571:

P.5.18. Indique la respuesta verdadera en relación con la siguiente


tabla de frecuencias de dos variables asociadas (x, y).
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
127

(a) El coeficiente de determinación toma el valor 0,78 aproximadamente


(b) La recta de regresión de y sobre x es aproximadamente y= -575 + 2,783x
(c) La recta de regresión de x sobre y es aproximadamente x = 55,589 -
0,9987y
(d) Todas las anteriores son falsas

Solución: La opción (d).

Justificación: Como se demuestra a continuación, la opción (a) es falsa porque


el coeficiente de determinación toma el valor 0,311 aproximadamente. La
opción (b) es falsa porque la recta de regresión de y sobre x es
aproximadamente y = -26,272 + 0,354x. La opción (c) es falsa porque la recta
de regresión de x sobre y es aproximadamente x = -167,823 + 0,879y.

Cálculo: A continuación se describe el proceso de cálculo de las cuestiones


planteadas.

Yi X¡

30 200
40 258
78 244
68 231
88 209
22 215
10 113

En primer lugar, se calcula la recta de regresión de y sobre x. Los coeficientes


vienen dados por las siguientes expresiones:
b= m" :::: o3537
m 20 '

a=a01 - ba10 :::: - 26,2 721

Por tanto, la recta de regresión de y sobre x es aproximadamente: y =


26,272+ 0,354x

De forma análoga se calculan los coeficientes de la recta de regresión de x


sobre y:
128 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Por lo que la recta de regresión de x sobre y, es aproximadamente: x =


167,823 + 0,879y

La Bondad del Ajuste viene dada por el Coeficiente de Determinación R2 , cuya


'
expresiones
2
la siguiente: R = rrif* i ~~ O,3 1 1
mio mo2
SERIES TEMPORALES 129

CAPÍTULO 6. NÚMEROS ÍNDICES

6.1. Preguntas Teóricas

T.6.1. Un número índice es:

(a) Una referencia que nos sirve para encontrar una estadística
(b) Una medida estadística que tiene utilidad para efectuar comparaciones en
diferentes momentos o periodos, respecto de una variable
(c) Una medida estadística que relaciona dos o más variables y que resulta de
gran interés para la predicción del comportamiento futuro de las mismas y
del grado de asociación y correlación entre ellas.
(d) Las opciones (b) y (c) son ciertas

Solución: La opción (b ).

Justificación: Las opciones (a) y (c) son falsas porque un Número Índice es
una medida estadística diseñada para poner de manifiesto los cambios en una
variable (o grupo de variables relacionadas) con respecto a una determinada
característica (generalmente, el tiempo). Se utilizan para efectuar
comparaciones en diferentes momentos o periodos, respecto de una variable.
La opción ( d) es falsa porque la opción ( c) es falsa .

T.6.2. Indique cuál de las opciones siguientes es falsa.

(a) En el caso de tres periodos la Propiedad cíclica o circular se puede


/º ¡e / ª
expresar mediante la igualdad -ª·-º·-' = 1
100 100 100
(b) Por la propiedad de Existencia, todo número índice ha de tener un valor
finito mayor que cero
(c) Por la propiedad de Existencia, todo número índice ha de tener un valor
finito distinto de cero
(d) Las opciones (a) y (c) son verdaderas

Solución: La opción (b).

Justificación: La opción (b) es falsa porque por la propiedad de Existencia,


todo número índice ha de tener un valor finito distinto de cero.
130 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.6.3. Indique cuál de las opciones siguientes es verdadera.

(a) En el caso de tres periodos la propiedad cíclica o circular de los números


, d.ice
in se puede expresar med.1ante 1a 1gua
• Id ad t; !ª = o
/ º ._._e

100 100 100
(b) La propiedad cíclica o circular modificada de los números índice se
desprende de las propiedades cíclica y de inversión temporal y para el caso
¡o ¡e ¡e
de tres periodos se puede expresar como -ª·- º =- ª
100 100 100
( c) Por la propiedad de Homogeneidad, si en el período actual todas las
magnitudes experimentan una variación proporcional, el número índice
tiene que experimentar también dicha variación.
(d) Todas las respuestas son falsas

Solución: La opción (b).

Justificación: La opción (a) es falsa porque en el caso de tres periodos la


propiedad cíclica o circular de los números índice se puede expresar mediante
la igualdad Jl._!l_._!;_ = t. La opción (c) es falsa porque por la propiedad de
100 100 100
Homogeneidad, un número índice no puede estar afectado por los cambios
que se realicen en las unidades de medida. La opción (d) es falsa porque la
opción (b) es verdadera.

T.6.4. Indique cuál de las opciones siguientes es falsa.

(a) En el caso de tres periodos la propiedad cíclica o circular de los números


índice se puede expresar mediante la igualdad Jl._!l_._!;_ = 1
100 100 100

(b) La propiedad de Identidad de los números índice consiste en que si se


hacen coincidir el período base y el período actual el valor del índice tiene
que ser igual a la unidad (o a 100 si se elabora en porcentajes)
(c) Por la propiedad de Homogeneidad, un número índice no puede estar
afectado por los cambios que se realicen en las unidades de medida.
(d) La propiedad de Identidad de los números índice se puede expresar
¡n I '
- '·- " =I
100100

Solución: La opción (d).


SERIES TEMPORALES 131

Justificación: La opción (d) es falsa porque la propiedad de Identidad de un


número índice consiste en que si se hacen coincidir el período base y el
período actual el valor del índice tiene que ser igual a la unidad (o a 100 si se
elabora en porcentajes); en la notación habitual: /~ = 100 .

T.6.5. Indique cuál de las opciones siguientes es falsa.

(a) En el caso de tres periodos la propiedad cíclica o circular de los números


' d.ice se pue de expresar med'1ant e 1a •1gua Id ad
m !º ·- !%·-! ª' = 1

100 100 100
(b) La propiedad de Proporcionalidad de los números índice consiste en que si
en el período actual todas las magnitudes experimentan una variación
proporcional, el número índice tiene que experimentar también dicha
variación.
(c) Por la propiedad de Homogeneidad, el valor del índice ha de ser invertible
al intercambiar los períodos entre sí. Es decir: .!2._!l = 1
100100
(d) Por la propiedad de Homogeneidad, un número índice no puede estar
afectado por los cambios que se realicen en las unidades de medida.

Solución: La opción (c).

Justificación: La opción (c) es falsa porque por la propiedad de


Homogeneidad, un número índice no puede estar afectado por los cambios
que se realicen en las unidades de medida.

T.6.6. En relación con los números índices, indique cuál de las


opciones siguientes es verdadera.

(a) La propiedad de la existencia viene definida por el hecho de que si se


hacen coincidir el período base y el período actual el valor del índice tiene
que ser igual a la unidad (o a 100 si se elabora en porcentajes); en la
notación habitual: /~ = 1oo .
(b) La propiedad de la Proporcionalidad indica que si en el período actual
todas las magnitudes experimentan una variación proporcional, el número
índice tiene que experimentar también dicha variación.
(c) La propiedad circular viene formulada en la siguiente forma: ..!l_._!l = 1
100 100
(d) Ninguna de las anteriores opciones es cierta

Solución: La opción (b ).
132 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE

Justificao6n: La opción (a) es falsa porque la propiedad de la existencia se


define como que todo número índice ha de tener un valor finito distinto de
cero. La opción (c) es falsa porque la propiedad circular viene formulada en la
siguiente forma: _!J_,_!l_.J;_ = 1. La opción (d) es falsa porque la opción (b) es
100 100 100
verdadera .

T.6.7. En relación con los números índices, indique cuál de las


opciones siguientes es verdadera.

(a) La propiedad de la identidad indica que un número índice no puede estar


afectado por los cambios que se realicen en las unidades de medida
(b) El valor del índice ha de ser invertible al intercambiar los períodos entre sí
(c) Todo número índice ha de ser mayor o igual que 100
(d) Ninguna de las anteriores es cierta

Soluo6n: La opción (b).

Justificación: La opción (a) es falsa porque la propiedad de identidad indica


que si se hacen coincidir el período base y el período actual, el valor del índice
tiene que ser igual a la unidad (o a 100 si se elabora en porcentajes); en la
notación habitual: 1; = 1oo. La opción (c) es falsa porque un número índice
puede ser menor que 100. La opción ( d) es falsa porque la opción (b) es
verdadera.

T.6.8. En relación con los números índices, indique cuál de las


opciones siguientes es verdadera.

(a) La propiedad de la identidad indica que todo número índice ha de tener un


valor finito distinto de cero
(b) La propiedad de la identidad significa que un número índice no puede
estar afectado por los cambios que se realicen en las unidades de medida
(c) La propiedad de la Inversión indica que el valor del índice ha de ser
invertible al intercambiar los períodos entre sí
(d) Todas las opciones son ciertas

So/uc16n: La opción (c) .

Justificación: Las opciones (a) y (b) son falsas porque la propiedad de


identidad indica que si se hacen coincidir el período base y el período actual, el
valor del índice tiene que ser igual a la unidad (o a 100 si se elabora en
porcentajes); en la notación habitual : 1; = 100. La opción (d) es falsa porque la
opción (c) es verdadera.
SERIES TEMPORALES 133

T.6.9. A partir de los siguientes datos, y considerando como año base


a 2011, indique cuál de las opciones siguientes es verdadera.

Años Precio
2010 95
2011 100
2012 115

(a) El nú mero índice de los precios en 2010 es 100


(b) El número índice de los precios en 2011 es 100
(c) El nú mero índice de los precios en 2012 es 100
(d) Ninguna de las opciones anteriores es verdadera

Solución: La opción (b).

Justificación: Las opciones (a) y (b) son falsas porque los valores de los
números índice de los precios en 2010 y 2012 son respectivamente 95 y 115
que coinciden con los valores de los precios, debido a que el precio del año
base 2011 es precisamente 100. La opción (d) es falsa porque la opción (b) es
verdadera. Para calcular los números índice simples hay que tener en cuenta
que se obtienen a partir de la razón de precios (precios relativos) respecto a
su valor en el período base y expresados en forma de porcentaje:

En nuestro caso, con el año 2011 como base:

12~,1 :· = ~º'º * 100 = ~ * 100 = 95


- ~llll 100

I~"" = ~"" * 100 = _!_QQ * 100 = 100


-"" ~º" 100

12º"= ~º'" • 1 00 = ~• 1 00 = 11 5
-º" P..:!tlll 100

T.6.10. A partir de los siguientes datos sobre los números índice de


los precios de un producto en base 2010, indique cuál de las
opciones siguientes es verdadera.
134 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Años Índices de los Precios


2010 100
2011 99,5
2012 103,4

(a) La variación porcentual de los precios entre los años 2010 y 2011 es 0,5%
(b) la variación porcentual de los precios entre los años 2010 y 2012 es 3,9%
(c) La variación porcentual de los precios entre los años 2010 y 2011 es -0,5%
(d) Ninguna de las opciones es verdadera

Solución: La opción (c).

Justificación: Las opciones (a) y (b) son falsas porque para calcular la
variación porcentual de los precios, al índice correspondiente a cada año con
base 2010, se le debe restar el valor de 100. Por tanto, la variación porcentual
de los precios entre los años 2010 y 2011 es -0,5% y la variación porcentual
de los precios entre los años 2010 y 2012 es 3,4%. La opción (d) es falsa
porque la opción (c) es verdadera.

T.6.11. Se conoce que las variaciones porcentuales de los precios de


los pimientos aumentaron el 2,5 por ciento en 2012 respecto a 2011
y disminuyeron el 1,5 por ciento en 2010 respecto a 2011.
Considerando como año base a 2011, indique cuál de las opciones
siguientes es falsa.

(a) El número índice de los precios de los pimientos en 2011 es 100


(b) El número índice de los precios de los pimientos en 2010 es 98,5
(c) El número índice de los precios de los pimientos en 2012 es 102,5
(d) El número índice de los precios de los pimientos en 2012 es menor que el
número índice de los precios de los pimientos en 2010

Solución: La opción (d).

Justificación: La variación porcentual de los precios entre cada año y el base


2011, se obtiene restando al índice del año la magnitud 100 que es el valor del
índice en el año base 2011. Por tanto los números índice de los precios de los
pimientos en 2012, 2011 y 2010 son respectivamente, 102,5; 100 y 98,5. Es
decir, el número índice de los precios de los pimientos en 2012 es mayor que
el número índice de los precios de los pimientos en 2010 y la opción (d) es
falsa.
SERIES TEMPORALES 135

T.6.12. Conocemos que el índice simple de precios para 2011 con


base en 2010 para un bien se situó en un valor de 150. Si en 2012 se
encarece el precio en un 10°/o respecto del año anterior, el índice
simple de precios para 2012 con base en 2010 sería igual a:

(a) 160
(b) 165
(c) 260
(d) 166,7

Solución: La opción (b ).

Justificación: La opción (b) es verdadera porque la variación porcentual de los


precios es la misma que la de los correspondientes índices debido a la propia
definición de número índice, que se obtiene a partir de la razón de precios
(precios relativos) respecto a su valor en el período base: /~ = P¡ * 1oo
Po
Por ello, el índice simple de precios para 2012 con base en 2010 es:

2012 150 ® (1+ 0,1) = 165


/ 2010=

T.6.13. En relación con los números índices, indique cuál de las


opciones siguientes es verdadera.

(a) Los índices complejos son aquellos que poseen una raíz compleja
(b) La magnitud de un índice complejo no puede ser menor de 100
( c) El índice media agregativa ponderada de índices simples es un número
N
, :¿ x,,w,
Indice complejo y se define: / -- ...!=l_
N
. 100 , siendo w, las ponderaciones
¿ x'° w,
1-J

(d) Ninguna de las opciones es verdadera .

Solución: La opción (c).

Justificae16n: La opción (a) es falsa porque los índices complejos son


agregaciones de los índices simples. La opción (b) es falsa porque la magnitud
de un índice complejo puede ser menor que 100. La opción (d) es falsa
porque la opción (c) es verdadera.
136 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.6.14. Indique cuál de las opciones siguientes es falsa.

a) El Índice de Laspeyres es una media aritmética ponderada de índices


simples, cuyo criterio de ponderación es: w, = P,A 0
(b) En el Índice de Laspeyres se valora el consumo del año base a precios del
año en estudio (en el numerador) y a precios del año base (en el
denominador).
(c) Se suele utilizar este índice a la hora de elaborar los índices de precios por
cuestiones prácticas ya que únicamente requiere investigar en el año base
el va lor de los ponderadores
(d) El Índice de Laspeyres no puede ser mayor que 100

Solución: La opción (d).

Justificación: La opción (d) es falsa porque por la propia definición de todo


número índice, puede ser mayor que 100.

T.6.15. Indique cuál de las opciones siguientes es verdadera.

a) El Índice de Paasche es una media aritmética ponderada de índices simples,


cuyo criterio de ponderación es: w, = p,0 Q,0
(b) En el Índice de Paasche se valora el consumo del año base a precios del
año en estudio (en el numerador) y a precios del año base (en el
denominador)
(c) El Índice de Paasche presenta el inconveniente de que sólo permite
comparar la evolución del precio de cada año con el del año base, dado
que las ponderaciones varían de período en período
(d) Ninguna de las anteriores es verdadera

Solución: La opción (c).

Justificación: La opción (a) es falsa porque el Índice de Paasche es una media


aritmética ponderada de los Índices simples, pero utilizando como coeficiente
ponderador w, = Pio Q,, ; La opción (b) es falsa porque el Índice de Paasche se

puede expresar como IPPa" = ~ Pn· qn · I oo,


es decir se valora el consumo de
Po· qn
cada año a precios del año en estudio (en el numerador) y a precios del año
base (en el denominador). La opción (d) es falsa porque la opción (c) es
verdadera .
SERIES TEMPORALES 137

T.6.16. Indique cuál de las opciones siguientes es falsa.

a) El Índice de Fisher es la media geométrica de los Índices de Laspeyres y


Paasche, es decir, FP = ~
(b) El Índice de Fisher es la media aritmética de los Índices de Laspeyres y
Paasche
(c) El Índice de Fisher no puede ser negativo
(d) Las opciones (a) y (c) son verdaderas

Solución: La opción (b).

Justificación: La opción (b) es falsa porque el Índice de Fisher es la media


geométrica de los Índices de Laspeyres y Paasche, es decir, FP = ~

T.6.17. Indique cuál de las afirmaciones siguientes es verdadera.

(a) El Índice de Laspeyres es una media geométrica ponderada de índices


simples
(b) El índice de Fisher es la media armónica de los Índices de Laspeyres y
Paasche
(c) Para calcular el Índice de precios de Paasche es necesario conocer los
consumos y precios de cada año
(d) Ninguna de las opciones anteriores es verdadera

Solución: La opción (c).

Justificación: La opción (a) es falsa porque el Índice de Laspeyres es una


media aritmética ponderada de índices simples. La opción (b) es falsa porque
el índice de Fisher es la media geométrica de los Índices de Laspeyres y
Paasche. La opción (d) es falsa porque la opción (c) es verdadera.

T.6.18. Indique cuál de las afirmaciones siguientes es verdadera.

(a) El Índice de Fisher es una media aritmética ponderada de índices simples


(b) Para calcular el Índice de Paasche necesitamos conocer los mismos datos
que para calcular el Índice de Laspeyres
( c) Para el año base coinciden las magnitudes de los índices de Laspeyres y
Paasche pero el índice de Fisher puede ser diferente
(d) El Índice de precios de Laspeyres no puede ser igual a cero

Solución: La opción (d).


138 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Justificación: La opción (a) es falsa porque el índice de Fisher es la media


geométrica de los Índices de Laspeyres y Paasche. La opción (b) es falsa
porque en el caso del índice de Paasche debemos conocer también los
consumos de cada año. La opción (c) es falsa ya que por la propia definición
del índice de Fischer, debe coincidir para el año base con los Índices de
Laspeyres y Paasche, al ser igual a 100.

T.6.19. Indique cuál de las afirmaciones siguientes es falsa.

(a) Para calcu lar el Índice de Fisher basta con conocer los Índices de
Laspeyres y Paasche
(b) Para calcular el Índice de precios de Laspeyres es necesario conocer los
consumos de cada año
(c) El índice de Fisher es la media geométrica de los Índices de Laspeyres y
Paasche
(d) El Índice de precios de Fisher no puede ser igual a cero

Solución: La opción (b).

Justificación: La opción (b) es falsa porque para calcular el Índice de precios


de Laspeyres no es necesario conocer los consumos de cada año como ocurre
con el Índice de precios de Paasche.

T.6.20. Indique cuál de las afirmaciones siguientes es falsa.

(a) El Índice de Paasche es una media geométrica ponderada de índices


simples
(b) Para calcular el Índice de Fisher basta con conocer los Índices de
Laspeyres y Paasche
( c) El índice de Fisher es la media geométrica de los Índices de Laspeyres y
Paasche
(d) El Índice de precios de Fisher para el año base es igual a 100

Solución: La opción (a).

Justificación: La opción (a) es falsa porque el Í ndice de Paasche no es una


media geométrica ponderada de índices simples.
SERI ES TEMPORALES 139

T.6.21. Indique cuál de las afirmaciones siguientes es falsa.

(a) Para calcular el Í ndice de Paasche es suficiente con conocer los Índices de
Laspeyres y Fisher
(b) El índice de precios de Laspeyres utiliza como coeficientes de ponderación
el valor de las transacciones en el periodo base (p¡0q,0)
(c) Para calcular el Índice de Laspeyres necesitamos conocer solamente los
precios del año base
(d) El cuadrado del Índice de Fisher es igual al producto de los Índices de
Laspeyres y Paasche

Solución: La opción (c).

Justificación: La opción (c) es falsa porque se necesitan conocer aparte de los


precios del año base, las cantidades del año base y los precios de cada año.

T.6.22. El coeficiente de ponderación del índice de Laspeyres es:

(a) Pit·q¡o
(b) p¡o·q¡o
(c) p¡o·q¡t
(d) Ninguna de las respuestas es correcta

Solución: La opción (b).

Justificación: Las opciones (a) y (c) son falsas porque el coeficiente de


ponderación del índice de Laspeyres es p¡o· q¡o. La opción (d) es falsa porque la
opción(b)esve~adera.

T.6.23. Se dispone de los datos siguientes sobre las magnitudes de


un número Índice en base 2009. Se realiza un cambio de base al año
2010. Indique cuál de las opciones siguientes es falsa.

AÑO 2009 2010 2011 2012


Índice base 95 100 110
100
2009

(a) El Índice del año 2011 en base 2010 es 100


(b) El Índice del año 2010 en base 2010 es 100
(c) El Índice del año 2012 en base 2010 es mayor que en base 2009
(d) El Índice del año 2011 en base 2010 es menor que en base 2009

Solución: La opción (d).


140 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Justificación: La opción (d) es fal sa porque, como se comprueba en la tabla


adjunta, donde se presentan las soluciones, el Índice del año 2011 en base
2010 (aproximadamente igual a 105,26) es mayor que el Índice del año 2011
en base 2009 (igual a 100).

Índice base Índice base


AÑO
2009 2010
2009 100 105,26
2010 95 100,00
2011 100 105,26
2012 110 115,79

La forma de calcular los índices en la nueva base es la siguiente:


¡t - /~009 100 . -
2010 - ¡ 2010 x ; Por eJemplo para los anos 2011 y 2012:
2009

1;g 11 ~ = li~ X 100::::; )05,26


/
2012
2010
= _!_!Q
95
X 100 ::::; 115 79
'

T.6.24. Indique cuál de las siguientes opciones es verdadera.

(a) Para pasar de una serie en moneda corriente a otra en moneda constante
se procede multiplicando la primera por un índice de precios adecuado
(b) La propiedad de Existencia de un número índice consiste en que todo
número índice ha de tener un valor finito distinto de cero e inferior a 100
( c) El Índice de Fisher es la media aritmética de los Índices de Laspeyres y
Paasche
(d) Ninguna de las respuestas es verdadera

Solución: La opción (d).

Justificación: La opción (a) es falsa porque para pasar de una serie en moneda
corriente a otra en moneda consta nte se procede dividiendo la primera por un
índice de precios adecuado. La opción (b) es falsa porque la propiedad de
Existencia de un número índice consiste en que todo número índice ha de
tener un valor finito distinto de cero. La opción ( c) es falsa porque el Índ ice de
Fisher es la media geométrica de los Índices de Laspeyres y Paasche .

...
SERIES TEMPORALES 141

T.6.25. En relación con los números índices, indique cuál de las


siguientes opciones es verdadera.

(a) Los denominados Índices Media (Aritmética, Armónica, Geométrica y


Agregativa), son números Índices Complejos, que pueden ser con o sin
ponderación
(b) Los Índices de precios más comunes se elaboran utilizando índices
complejos ponderados; los más utilizados son el Índice de Paasche y el de
Fisher
(c) El Índice de Fisher se define como la media armónica de los índices de
Laspeyres y Paasche
(d) Ninguna de las anteriores opciones es cierta

Solución: La opción (a) .

Justificación: La opción (b) es falsa porque los Índices de precios más


comunes se elaboran utilizando índices complejos ponderados; el más
empleado es el denominado Índice de Laspeyres. La opción ( c) es falsa
porque el Índice de Fisher se define como la media geométrica de los índices
de Laspeyres y Paasche. La opción (d) es falsa porque la opción (a) es
verdadera.

T.6.26. En relación con los números índices, indique cuál de las


siguientes opciones es verdadera.
(a) La propiedad circular viene formulada en la siguiente forma: _!l_.~ = 1
100 100
(b) Para el año base coinciden las magnitudes de los índices de Laspeyres y
Paasche pero el índice de Fisher puede ser diferente
(c) Los Índices de precios más comunes se elaboran utilizando índices
complejos ponderados; los más utilizados son el Índice de Paasche y el de
Fisher
(d) En el caso de tres periodos la propiedad cíclica o circular de los números
índice se puede expresar mediante la igualdad _E_._.!l_.J;_ = 1
100 100 100

Solución: La opción (d).

Justificación: La opción (a) es fal sa porque la propiedad circular viene


formulada en la siguiente forma: _!J_ ..!.l._!l_ = 1 • La opción (b) es falsa porque
100 100 100
para el año base coinciden las magnitudes de los índices de Laspeyres,
Paasche y Fisher. La opción (c) es falsa porque los Índices de precios más
comunes se elaboran utilizando índices complejos ponderados; el más
empleado es el denominado Índice de Laspeyres.
142 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.6.27. En relación con los números índices, indique cuál de las


siguientes opciones es falsa.

(a) El Índice de Laspeyres es una media aritmética ponderada de índices


simples, cuyo criterio de ponderación es: w, = p,0 Q,0
(b) El Índice de Paasche presenta el inconveniente de que sólo permite
comparar la evolución del precio de cada año con el del año base, dado
que las ponderaciones varían de período en período
( c) Por la propiedad de Existencia, todo número índice ha de tener un valor
finito mayor que cero
(d) El Índice de precios de Fisher no puede ser igual a cero

Solución: La opción (c).

Justificación: La opción (c) es falsa porque por la propiedad de Existencia,


todo número índice ha de tener un valor finito distinto de cero.

T.6.28. En relación con los números índices, indique cuál de las


siguientes opciones es falsa.

(a) Los denominados Índices Media (Aritmética, Armónica, Geométrica y


Agregativa), son números Índices Complejos, que pueden ser con o sin
ponderación
(b) La propiedad de Identidad de los números índice se puede expresar
¡n ¡t
_1._n=I
100 100
(c) Para calcular el Índice de Fisher basta con conocer los Índices de
Laspeyres y Paasche
(d) La propiedad de la Proporcionalidad indica que si en el período actual
todas las magnitudes experimentan una variación proporcional, el número
índice tiene que experimentar también dicha variación

Solución: La opción (b).

Justificación: La opción (b) es falsa porque la propiedad de Identidad de los


números índice se puede expresar: /~ = 1oo .
SERIES TEMPORALES 143

T.6.29. En relación con los números índices, indique cuál de las


siguientes opciones es verdadera.

(a) La propiedad de la identidad significa que un número índ ice no puede


estar afectado por los cambios que se rea licen en las unidades de medida
(b) Para pasar de una serie en moneda corriente a otra en moneda constante
se procede multiplicando la primera por un índice de precios adecuado
(c) El Í nd ice de Fisher se define como la media armónica de los índices de
Laspeyres y Paasche
(d) Ninguna de las anteriores es verdadera

Solución: La opción (d).

Justificación: La opción (a) es fa lsa porq ue la propiedad de la identidad


significa que si se hacen coincidir el período base y el período actual el valor
del índice tiene que ser igual a la unidad (o a 100 si se elabora en
porcentajes). La opción (b) es falsa porque para pasar de una serie en
moneda corriente a otra en moneda constante se procede dividiendo la
pri mera por un índice de precios adecuado. La opción (c) es falsa porque el
Índice de Fisher se define como la media geométrica de los índices de
Laspeyres y Paasche.

T.6.30. En relación con los números índ ices, indique cuál de las
siguientes opciones es falsa.

(a) El índice media agregativa ponderada de índices simples es un número


N

¿ x,1w,
Índice complejo y se define: I = 'N 1 . 1oo, siendo w, las ponderaciones
¿x,o w,
1 1

(b) Un número índice es una medida estadística que relaciona dos o más
variables y que resulta de gran interés para la predicción del
comportamiento futuro de las mismas y del grado de asociación y
correlación entre ellas
(c) El Índice de precios de Fisher para el año base es igual a 100
(d) El cuadrado del Índice de Fisher es igual al producto de los Índices de
Laspeyres y Paasche

Solución: La opción (b).

Justificao6n: La opción (b) es fa lsa porque un número índice es una medida


estadística diseñada para poner de manifiesto los cambios en una variable (o
grupo de variables relacionadas) con respecto a una determinada
característica (generalmente, el tiempo).
144 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

6.2. Problemas

P.6.1. A partir de los siguientes datos, y considerando como año base


a 2010, indique cuál de las opciones siguientes es falsa.

Años Precio
2009 183
2010 196
2011 191
2012 196

(a) El número índice de los precios en 2010 con base en 2010 es 100
(b) Los precios se han reducido en 2011 respecto a 2010 en aproximadamente
el 2,55%
(c) El número índice de los precios en 2012 con base en 2010 es 100
(d) El número índice de los precios en 2012 con base en 2010 es
aproximadamente 102,53

Solución: La opción (d).

Justificación: La opción (d) es fa lsa porque el número índice de los precios en


2012 con base en 2010 es 100.

Cálculo: Para ca lcular los números índice y las variaciones porcentuales de los
precios hay que tener en cuenta que los números índices se obtienen a partir
de la razón de precios (precios relativos) respecto a su valor en el período
base:
/~ = P¡ * 100
Po
Asimismo, las variaciones o incrementos porcentuales de los precios entre el
año t y el t+ 1, se calculan comparando los números índice o las magnitudes
de los precios mediante la expresión siguiente:

I
Y,l• = ll ;,I )X] j- 00 100

En nuestro caso, con el año 2010 como base:

I ~º" = ~oi:. • 100 =~ • 1 00 = 100


. 0 10 f:: o10 196
1

VPJ~'1';=(( P,•., x100J- 100 =((.!2.!.)x 100)- 100 = !J,º: - t;;:,'i=97A5- 100" -2.55°o
l P,OlU/ 196
SERIES TEMPORALES 145

Los demás resultados se muestran en la tabla adjunta.

Í ndice Variación porcentual anual de


Años Precio
2010=100 los precios (en % )
2009 183 93,37
2010 196 100 7,10%
2011 191 97,45 -2,55%
2012 196 100 2,62%

P.6.2. Con los siguientes datos sobre medias de los alumnos


aprobados en diversos exámenes de Estadística en los centros
asociados de la UNED; indique cuál de las siguientes opciones es
verdadera.

Madrid Córdoba Palencia Sevilla


Junio 2010 5,3 5,3 6,5 6
Septiem bre 2010 5,6 5,2 5,2 6,3
Junio 2011 7,3 5,3 5,3 6,3
Septiembre 2011 6,1 5,5 5,5 6,4
Junio 2012 6,3 5,7 5,7 5,7
Septiembre 2012 5,8 5,2 5,2 6,9

(a) La nota media de los alumnos aprobados en Septiembre de 2010 en estos


centros es aproximadamente 5,52
(b) En el centro de Madrid el índice de notas de Sept iembre de 2012 respecto
a j unio de 2010, se aproxima a 109,434, mient ras que en Sevilla dicho
índice alcanza el valor 115
(c) El mayor descenso de notas entre ambos períodos Uunio de 2010 y
Septiembre de 2012) corresponde a Córdoba
(d) El mayor aumento de notas entre junio y septiembre de 2010 correspondió
a Sevilla

Solución: La opción (b) .

Justificación: A continuación se comprueba que las opciones (a), (c); y (d) son
falsas y se indican las soluciones verdaderas.

Cálculo: La opción (a) es falsa ya que la nota media de los alumnos aprobados
en Septiembre de 2009 en estos cent ros es aproximadamente 5,575. En
relación con la opción (b), en la tabla adjunta se muestran las magnitudes de
los índices de cada centro, tomando como base a junio de 2010. Para calcular
los números índice hay que tener en cuenta que se obtienen a partir de la
146 EJERCICI OS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE

razón entre las notas en la convocatoria correspondiente y en la convocatoria


que se considera como base (mu ltipl icado por 100 para que en el año base
sea igual a 100). Así, el índice de notas de septiembre de 2012 respecto a
junio de 2010 en el centro de Madrid, se aproxima a 109,434 mientras que en
Sevilla dicho índice alcanza el valor 115. Para el caso de Madrid, la fórmula
empleada es la siguiente:

!MAOR/Osep-li
¡un-10
= 5•,8·100 => IMAOR/0 ¡un
5
CP
11
::::
111 -
109' 434
53

ÍNDICES (septiembre de 2012 respecto a junio de


2010)
Fechas Madrid Córdoba Palencia Sevilla
jun-10 100 100 100 100
sep-10 105,660 98,113 80 105
jun- 11 137,736 100 81,538 105
sep-11 115,094 103,774 84,615 106,667
jun-1 2 118,868 107,547 87,692 95
sep-12 109,434 98, 113 80 115

Finalmente, dicha tabla nos permite la comprobación de que las opciones (c) y
(d) son falsas ya que el mayor descenso de notas entre ambos períodos Uunio
de 2010 y Septiembre de 2012), que se obtiene como la diferencia entre los
índices correspondientes a las respectivas fechas, no corresponde a Córdoba
sino a Palencia. Asimismo, el mayor aumento de notas entre junio y
septiembre de 2010 no corresponde a Sevilla sino a Madrid.

P.6.3. Se sabe que el precio de un producto en el año 2011 fue de


200 euros. Además, se conocen los índices simples referentes al
=
2011 y 2012 con base en 2010, 111110 120; 112110 132. A partir de =
tal información, podemos concluir que:

(a) El precio del bien en 2012 es 252 euros


(b) La variación porcentual del precio durante el período 2010-11 es el 12%
(c) La variación porcentual del precio del bien para el período 2010-12 es el
20%
( d) Ninguna de las opciones anteriores es cierta

Solución: La opción (d).


SERIES TEMPORALES 147

Justificación: Como se muestra a continuación, donde se presentan los


resultados de los cálculos realizados, la opción (a) es falsa porque el precio del
bien en 2012 fue de 220 euros. Asimismo, la opción (b) es falsa porque la
variación porcentual del precio durante el período 2010-11 es el 20%.
Finalmente, la opción (c) es falsa porque la variación porcentual del precio del
bien para el período 2010-12 es el 32%.

AÑO Índice base 2010 Precio Variación de precios (%)


2010 100 166,67
2011 120 200 V(2010-11) = 20%
2012 132 220 V(2010-12) = 32%

Cálculo:

Para calcular los precios a partir de los números índice hay que tener en
cuenta que los precios se obtienen a partir de la razón de los números índice,
análogamente a como se ha realizado para el cálculo de los números índice,
basándose en el mantenimiento de las razones, es decir en una simple regla
de tres. La fórmula para obtener el precio del año 2012, a partir del precio en
2011 que es 200, es la siguiente:

/"º12 132
= P (en 20 11 ) ;~ ~ = 200* - = 220
1;011 0
1
P (en 20 12)
120

Asimismo, las variaciones o incrementos porcentuales de los precios entre el


año t y el t+ 1, se calculan comparando los números índice o las magnitudes
de los precios mediante la expresión siguiente:

En nuestro caso, con el año 2010 como base:

J- l00:::::: 2Qo/c
l
¡ 2011
v:20 11 = 20 1o x lOO
2010 ¡ 2010 o
2010

2012
V.2010 =
¡ 20 12
~
J
X 100 -100:::::: 32o/co
¡ 20 10
(
2010

El resultado es el mismo si empleamos otro método consistente en restar los


correspondientes valores de los índices de cada año en la misma base. Es
148 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

decir, como el índice en base 2010 para el año 2010 es 100, habría que restar
100 al índice del año en base 2010 para obtener la variación porcentual entre
el año base y el año en cuestión. No debe olvidarse que este método solo se
puede aplicar cuando calculemos la variación porcentual de los precios entre el
año base y ot ro año. En nuestro caso:

112011 _ ¡ 2011 ¡ 2010 _ - o


V20 10 - 2010 - 2010 - 120- J 00 - 20 Yo
112012_ ¡ 2012
V2010 - 2010 -
¡ 2010 _
2010 -
132 - 100 -3201
- /O

P.6.4. Con los siguientes datos, elaborar un Índice de los precios con
base el año 2007 = 100 e indicar cuál de las siguientes afirmaciones
es falsa .

Años Precio
2007 150
2008 158
2009 168
2010 175
2011 183
2012 196

(a) El Índice de los precios en 2010 es aproximadamente 116,667


(b) La variación porcentual de los precios en el período 2007-2011 es
aproximadamente el 22 %
(c) Si se duplican todos los precios de cada año del periodo 2007-2012,
también se duplica la variación porcentual de los precios en el período
2007-2010
(d) Las opciones (a) y (b) son verdaderas

Solución: La opción (c).

Justificación: La opción (c) es falsa porque como se demuestra a continuación,


si se duplican todos los precios de cada año del periodo 2007-2012, la
variación porcentual de los precios en el período 2007-2010 se mantiene
constante.

Cálculo: Para calcular los números índice y las variaciones porcentua les de los
precios hay que tener en cuenta que los números índices se obtienen a partir
de la razón de precios (precios relativos) respecto a su valor en el período
base:
SERIES TEMPORALES 149

Por ejemplo, en el caso del año 2010 y tomando el año 2007 como base:

1;~~~ = Pioio • 100 = ~ • 100 ::: 116,667


- ~U07 150

Asimismo, las variaciones o incrementos porcentuales de los precios entre el


año t y el t+ 1, se calculan comparando los números índice o las magnitudes
de los precios mediante la expresión siguiente:

El resultado es el mismo si empleamos otro método más sencillo consistente


en restar los correspondientes valores de los índices de cada año en la misma
base. Es decir, como el índice en base 2007 para el año 2007 es 100, habría
que restar 100 al índice del año en base 2011 para obtener la variación
porcentual entre el año base y el año en cuestión. No debe olvidarse que este
método solo se puede aplicar cuando calculemos la variación porcentual de los
precios entre el año base y otro año. Este es el método que aplicamos en este
ejercicio . Por ejemplo, con el año 2007 como base :

1/201 1 -
V2007 -
¡ 20 1 1
2007 -
¡ 2007 -
2007 -
122 - 100 -- 2201
/O

Los resultados completos se muestran en la tabla adjunta .

Índice Variación porcentual


Años Precio
2007=100 respecto 2007 (%)
2007 150 100
2008 158 105,333 5,33%
2009 168 112 12%
2010 175 116,667 16,67%
2011 183 122 22%
2012 196 130,667 30,67%

Caso 2º: Se duplican los precios.

Después de duplicarse los precios y aplicando las mismas fórmulas anteriores,


se obtienen los resultados que se muestran en la tabla adjunta. Se observa
que las magnitudes de los índices y de las variaciones porcentuales se
mantienen constantes.
150 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Índ ice Variación porcentual


Años Precio
2007 = 100 respecto 2007 (%)
2007 300 100
2008 316 105,333 5,33%
2009 336 112 12%
2010 350 116,667 16,67%
2011 366 122 22%
2012 392 130,667 30,67%

P.6.5. Disponemos de los siguientes datos de una serie. lCuál de las


siguientes respuestas es verdadera en términos aproximados?

Años Va lor
2008 10 1

2009 14
2010 20
2011 25
2012 30

(a) El índice para 2011 con base 100 en 2008 es de 200 y el año con mayor
incremento relativo en relación con el año anterior es 2010
(b) El índice para 2011 con base 100 en 2008 es 250 y el incremento de 2009
sobre el 2008 del 40%
(c) El índice para 2010 con base 100 en 2008 es 200 y el incremento de valor
en todo el período analizado 2008-2012 es del 200%
(d) Ninguna de las respuestas es verdadera

Solución: La opción (c).

Justificación: La opción (a) es falsa porque como se muestra en la tabla


siguiente, el índice para 2011 con base 100 en 2008 es 250 y el año con
mayor incremento relativo en relación con el año anterior es 2010. La opción
(b) es falsa porque el índice en 2011 con base 100 en 2008 es 250 y el
incremento de 2009 sobre el 2008 del 25%. La opción (d) es falsa porque la
opción (c) es verdadera .

Cálculo: En la tabla siguiente se muestran todos los resultados.


SER IES TEMPORALES 151

Índices Variación Variación porcentual


Años base 100 porcentual anual de precios respecto
en 2008 de precios (%) 2008
2008 100
2009 140 40% 40%
2010 200 42,86% 100%
2011 250 25% 150%
2012 300 20% 200%

Para calcular los números índice y las variaciones porcentuales de los precios
hay que tener en cuenta que los números índices se obtienen a partir de la
razón de precios (precios relativos) respecto a su va lor en el período base:

/~ = P, * 100
?¡,
Por ejemplo, en el caso del año 2011 y con base 100 en 2008:

1;~~! = ~Ol I • 25
100 = • 100"" 250
- ~008 1o
Asimismo, las variaciones o incrementos porcentuales de los precios entre el
año t y el t+ 1, se calculan compara ndo los números índice o las magnitudes
de los precios mediante la expresión siguiente:

v,•·I = ll '~,;I) X ) 00 J-)00


En nuestro caso, con el año 2010 como base, el incremento de 2009 sobre el
2008 es :
¡ 2009 J
~ 0~~
1 9
= ~~l~J~ X ) 00 - )00 ~ 40%
l / 2008
Asimismo, el incremento de va lor en todo el período analizado 2008-2012 es:

J
10 12
l/.2008
l
= ¡'O P X J00 - 100 ~ 20Qo/c
2 00S
¡ 2008
2008
o

P.6.6 . Los precios medios y niveles de ventas de tres empresas para


un determinado servicio durante los años 2010 y 2012 se muestran
en la tabla siguiente. Indique cuál es la opción verdadera . (Operar
con EXCEL o con seis decimales, al menos, en caso de calculadora)
152 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

2010 2012
Ventas Ventas
Precio Precio
(miles de euros) (miles de euros)
Empresa 1 610 85 690 94
Empresa 2 770 80 795 100
Empresa 3 630 96 650 115

(a) Los índices de Paasche y Laspeyres, con base en el año 2010, son,
respectivamente 105,958 y 106,133 aproximadamente
(b) Los índices de Paasche, Laspeyres y Fisher, con base en el año 2010 son,
respectivamente 105,121, 105,312 y 105,223 aproximadamente
(c) El índice de Fischer, con base en el año 2010, es 105,567
aproximadamente
(d) Ninguna de las opciones es cierta

Solución: La opción (a).

Justificación: Como se muestra a continuación, donde se presentan los


resultados de los respectivos índices, las opciones (b) y (c) son falsas. La
opción (d) es falsa porque la opción (a) es verdadera .

Las magnitudes de los índices son las siguientes:

• Índice de Laspeyres: 106,163


• Índice de Paasche: 105,958
• Índice de Fisher: 106,061

Cálculo: A continuación se describe el proceso de cálculo de los diferentes


índices:

Índice de precios de Laspeyres.

La fórmula empleada es: !Pt'o = L Pn·% ·100


l:Po· %

En primer lugar se calculan los dos sumatorios incluidos en la fórmula anterior.


1

1
SERIES TEMPORALES 153

i
Empresas P¡(l2) • Q¡(lO) P¡(lO) • Q¡(lO)
1

1 58.650 51.850
2 63.600 61.600
3 62.400 60.480
Total de sumas 184.650 173.930

Finalmente, se calcula el valor del índice aplicando la fórmula citada


anteriormente.

¡p¿12= 184.650 · 100 => ¡p¿12 ::::: 106 133


IO 173.930 IO '

Índice de precios de Paasche:


La fórmula empleada es: IPF¿ = ~ Pn· qn · Ioo
Po· qn

A continuación se calculan los dos sumatorios incluidos en la fórmula anterior.

Empresas P¡(l2) · Q¡(l2) P;(lO) · Q;(l2)


1 64.860 57.340
2 79.500 77.000
3 74750 72.450
Total de sumas 219.110 206.790

Finalmente, se calcula el valor del índice aplicando la fórmula citada


anteriormente.
/PP " = 219 · l IO· 100=> IPP " * 105.958
IO 206. 790 IO

Índice de precios de Fisher:

La fórmula empleada es : FP = ~ Lp · PP

Aplicando la fórmula citada se calcula el valor del índice :

/PF¡~; = ~ 1 06, 1 33 · I05,958 => /PF¡~2 ::::: 106,06 1

P.6.7. Con la siguiente información de precios y cantidades


consumidas de un conjunto de bienes, indique cuál de las siguientes
afirmaciones es falsa. (Operar con EXCEL o con seis decimales, al
menos, en caso de calculadora}
154 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

2010 2012
Consumo en Consumo en
Precio Precio
miles de euros miles de euros
Producto A 630 84 660 98
Producto B 870 78 750 120
Producto C 720 94 640 138

(a) El Índice de Laspeyres para 2012 con base en 2010 es aproximadamente


92,380
(b) El índice de Laspeyres para 2012 con base en 2010 es mayor que los
índices de Paasche y de Fisher para 2012 con base en 2010 1

(c) Para los dos años 2012 y 2010 no se verifica la propiedad de la inversión
temporal para el índice de Fisher
(d) Las dos primeras opciones son verdaderas
Solución: La opción (c).

Justificación: Las magnitudes de los índices de de Laspeyres, Paasche y Fisher


para 2012 con base en 2010 son aproximadamente 92,380; 91,525 y 91,952
como se demuestra a continuación y por lo tanto las opciones (a), (b) y (d)
son verdaderas. La opción (c) es falsa porque el índice de Fischer cumple la
propiedad de inversión que consiste en que el valor del índice ha de ser
invertible al intercambiar los períodos entre sí. Es decir, que el índice del año O
calcu lado con la base del año t, ha de ser igual al inverso del índice del año t
calculado en base del año O. Para nuestro caso se cumple la propiedad de
inversión temporal en el caso que se verifique la siguiente relación :
¡ 12 /'º
- '-º . ___!1_ = l
100 100

Para demostrarlo basta con calcular los valores de dicho índice a partir de los
índices de Laspeyres y Paasche, correspondientes a los años base 2010 y
2012, y comprobar que cumple dicha propiedad.

Cálculo:

Las magnitudes de los sumatorios necesarios para calcular los índices se


muestran en la siguiente tabla.

Productos P;(lO) · Q;( lO) P;( l2) · Q;(lO) P;(lO) · Q;(l2) P;( l2) · Q;(l2)
Producto A 52.920 55.440 61.740 64.680
Producto B 67.860 58.500 104.400 90.000
Producto C 67.680 60.160 99.360 88.320
Total de sumas 188.460 174.100 265.500 243.000
SERIES TEMPORALES 155

Año base 2010:

Índice de precios de Laspeyres.


La fórmula empleada es: !PI.!/;= L Pn·qº · 100
L Po·Qo
En nuestro caso,

174
!PL' 2 = · 1OO·I00 => IPL' 2 = 92 380
'º 188.460 IO '

Índice de precios de Paasche:


La fórmula empleada es: IPP:' - L Pn· qn · I oo
0
- L Po· qn
En nuestro caso,

¡pp i = 243.000 ·1 00:::> ¡pp z = 9 1 525


IO 265.500 'º '

Índice de precios de Fisher:

La fórmula empleada es: Fp = ~ Lp · Pp

En nuestro caso,

IPF¡~1 = J92,380·9 1 ,525 => IPF¡iº = 9 1,952

Año base 2012:

Índice de precios de Laspeyres.


La fórmula empleada es: !PI!;, = L Pn·% · 100
L Po· %
En nuestro caso,
/PL 1º =
ll
265 5
·
243.000
ºº ·
100=> IPL"
'º = 109'259
Índice de precios de Paasche:
La fórmula empleada es: /PF(/ =L Pn· qn · 100
L Po· qn
En nuestro caso,

188 6
!PP.,º= .4 0. 100 => !PP 1 = 108 248
I_ 174.100 IO '
156 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Índice de precios de Fisher:

La fórmula empleada es : FP = ~

En nuestro caso,

IPF¡~º = ) 109,259 · 108,248 ~ /PF¡12º = 108,753

Propiedad de inversión:

Para que se cumpla la propiedad de inversión:


IPF¡~~ IPF¡ 1,º . 9 1.952 108,753 .
- - · --- = l: Es decir - - · :::; 1como quenamos demostrar
100 l 00 100 100

P.6.8. Disponemos de los siguientes datos de ventas de una empresa


(ventas de 4 productos por unidades y años). Se considera el año
2010 como base. Indique cuál de las siguientes afirmaciones es
falsa. (Operar con EXCEL o con seis decimales, al menos, en caso de
calculadora)

Año 2010 2011 2012


Producto Precio Nº de unidades Precio n° de unidades Precio Nº de unidades
A 35 5000 37 6100 50 6600
B 40 3000 45 2200 47 2300
e 50 1500 55 1400 58 1600
D 65 1000 68 900 70 1100

(a) El índice de precios de Laspeyres en 2011 es mayor que el índice de Fisher


en 2011
(b) El índice de precios de Laspeyres en 2011 es mayor que el índ ice de
Paasche en 2011
(c) El índice de precios de Paasche en 2012 es mayor que el índice de Fisher
en 2012
(d) El índice de precios de Laspeyres en 2012 es mayor que el índice de Fisher
en 2012

Solución: La opción (d).

Justificación: A partir de los resultados que se muestran en la tabla adju nta


sobre los índices de Laspeyres, Paasche y Fisher en 2011 y 2012 con base en
2010, se deduce que las opciones (a), (b) y (c) son verdaderas y que la opción
SERIES TEMPORALES 157

(d) es falsa.

Magnitudes aproximadas de los Índices


En 2011 con año base 2010 En 2012 con año base 2010
Laspeyres 108,784 Laspeyres 129,189
Paasche 108, 129 Paasche 131,737
Fisher 108,456 Fisher 130,457

Cálculo:

Las magnitudes de los sumatorios necesarios para calcular los índices se


muestran en la siguiente tabla.

Producto P¡(lO)· P¡( 10)· P¡(lO) · P¡(l l)· P1(1l)· P1(12)· P1(12) ·
Q;( lO) Q;(ll) Q;(12) Q;( lO) Q;( ll) Q¡( lO) Q;(12)
A 175.000 213.500 231.000 185.000 225 .700 250.000 330.000
B 120.000 88.000 92.000 135.000 99.000 141.000 108.100
e 75.000 70.000 80.000 82 .500 77.000 87.000 92.800
D 65 .000 58.500 71.500 68.000 61.200 70.000 77.000
Total
370.000 37 1.500 403.000 402.500 401.700 478.000 530.900
Suma

Índice de precios de Laspeyres.


La fórmula empleada es: IPl.!/.i = L P; (}¡, . 100
L Po«l,,
En nuestro caso,

4 25
!PL1110 = º
· 00 · I 00 => IPL11 = 108 784
370.000 IO '

JPL1 ~ = 0. 00·100 => !PL1 ~ = 129. 189


53 9
IO 403.000 IO

Índice de precios de Paasche:

La fórmula empleada es : IPF{ = L Pn· qn· 100


L Po· qn
En nuestro caso,

4
!PP: ' = 0l.700· 100 => IPP ' = 108.129
IO 37 1.500 IO
158 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTI CA DE ADE

!PP" = 53 o.9oo . 100 => !PP " = 131.73 7


IU 403.000 !U

Índice de precios de Fisher:

La fórmula empleada es: FP = JLp. Pp


En nuestro caso,

/Pf¡~' =)108,784· 108.129 => IPF¡~'= 1 08,456


IPF¡~" =) 129. 189 · 131.737 => IPF¡~" = 130.457

P.6.9. Dada la siguiente tabla sobre precios y cantidades de 3


productos distintos que tiene una empresa en el mercado, se
calculan los índices de precios de Laspeyres, Paasche, Fischer y
Edgeworth para el año 2012, considerando como año base 2011,
indique cuál es la respuesta correcta. (Operar con EXCEL o con seis
decimales, al menos, en caso de calculadora)

Año 2011 Año 2012


Precio Cant idad Precio Cantidad
PRODUCTO 1 5 90 8 205
PRODUCTO 2 25 10 30 15
PRODUCTO 3 1000 240 1025 150

(a) El índice de Laspeyres es mayor que los demás


(b) El índice de Fisher es el más pequeño
(c) El índice de Paasche es el mayor
(d) El índice de Edgeworth es el más pequeño

Solución: La opción (c).

Justificación: A partir de los resultados que se muestran en la tabla adjunta


sobre los índices de Laspeyres, Paasche, Fisher y Edgeworth en 2012 con base
en 2011, se deduce que las opciones (a), (b) y (d ) son falsas y que la opción
(c) es verdadera.
SERIES TEMPORALES 159

Magnitudes aproximadas de los Índices


de precios en 2012 (con año base 2011)
Laspeyres 102,626
Paasche 102,933
Fisher 102,779
Edgeworth 102,744

Cálculo:

Las magnitudes de los sumatorios necesarios para calcular los índices se


muestran en la siguiente tabla.

P1(12)·Q,(11) P1( ll )•Q1(1l )


P¡(ll)• P,(12)· P1(1l)· P1(12)·
Productos
Q;(ll) Q¡( ll) Q;(l2) Q,(12) + +
P1(12)'Q¡(l2) P¡( ll)·Q,( 12)
Producto 1 450 720 1.025 1.640 2.360 1.475
Producto 2 250 300 375 450 750 625
Producto 3 240 .000 246.000 150.000 153.750 399.750 390.000
Total de
240 .700 247.020 151.400 155.840 402.860 392.100
sumas

Índice de precios de Laspeyres.


La fórmula empleada es : IPl.!/i = L Pn·% -100
L Po·%
En nuestro caso,

!PL1211 = ·º º
247 2
240.700
-100 => IPL1211 :::: 102 626
,

Índice de precios de Paasche:

La fórmula empleada es: !PF(/ = L Pn· qn · I oo


L Po· qn
En nuestro caso,

155 840
!PP.112 = - -100 ::::> !PP.112 :::; 102 933
151.400 ,

Índice de precios de Fisher:

La fórmula empleada es: Fp = ~


160 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

En nuestro caso,

IP~\~ = ../102.626· 102.933 => IP~\~ :::: 102.779

Índice de precios de Edgeworth:

En nuestro caso,

IPE111~= 4 º
2 86
· º· 100::::102.744
392. 100

P.6.10. En la siguiente tabla se agrupan los ingresos semanales


medios en miles de euros y las cantidades vendidas de tres
empresas. Se considera como año base el 2011. Indique la respuesta
verdadera. (Operar con EXCEL o con seis decimales, al menos, en
caso de calculadora)

2010 2011 2012


Empresas Ingreso Ingreso Ingreso
Cantidad Cantidad Cantidad
promedio promedio promedio
A 105,6 120 110,25 140 190,12 150
B 140,8 200 135,26 230 220,36 225
c 75,2 60 68,69 70 120,2 100

(a) El Índice de precios de Fischer en 2012 con base 2011 es


aproximadamente 167,146 y el índice de precios de Paasche en 2012 con
base 2011 es aproximadamente 166,173
(b) El Í ndice de precios de Laspeyres en 2012 con base 2011 es mayor que el
índice de precios de Paasche en 2012 con base 2011
(c) El Índice de precios de Laspeyres en 2012 con base 2011 es menor que el
índice de precios de Paasche en 2012 con base 2011
(d) Las opciones (a) y (c) son verdaderas

Solución: La opción ( c).

Justificación: A partir de los resultados que se muestran en la tabla adjunta


sobre los índices de Laspeyres, Paasche, y Fisher en 2012 con base en 2011,
se deduce que las opciones (a) y (b) son falsas y que la opción (c) es
verdadera. La opción (d) es falsa porque la opción (a) es falsa .
SERIES TEMPORALES 161

Magnitudes aproximadas de los Índices de precios


en 2012 (con año base 2011)
Índice de Laspeyres 166,910
Índice de Paasche 167,383
Índice de Fisher 167,146

Cálculo:

Las magnitudes de los sumatorios necesarios para calcular los índices se


muestran en la siguiente tabla.

P¡(ll )· P¡(l2)· P¡(ll)· P¡(l2)·


Empresas
Q¡(ll) Q¡(ll) Q¡(l2) Q¡(l2)
A 15.435 26.616,8 16.537,5 28.518
B 31.109,8 50.682,8 30.433,5 49.581
e 4.808,3 8.414 6.869 12.020
Total de sumas 51.353,1 85.713,6 53.840 90.119

Índice de precios de Laspeyres.

La fórmula empleada es: IPL,~ = L Pn·% · 100


L Po·Qo
En nuestro caso,

85 713 6
!PL12
11 = · · ·100 => !PL12
11
.:::: 166.9 1O
51.353, 1

Índice de precios de Paasche:

La fórmula empleada es: /Pf{ = L Pn· qn · I oo


L Po· qn
En nuestro caso,

IPP.112 = 90. l l 9 ·100 => !PP.11~ .: : 167 383


53.840 '

Índice de precios de Fisher:

La fórmula empleada es: Fp = ..{L;P;


162 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE AD E

En nuestro caso,

IPF¡\2 = .,)166.9 10· 167.383 ~ IPF¡\1 :::: 167,146

P.6.11. En la siguiente tabla se agrupan los ingresos promedio en


euros y las ventas en miles de euros de tres empresas. Tomando
como base el año 2011, indique cuál es la opción verdadera. (Operar
con EXCEL o con seis decimales, al menos, en caso de calculadora)

2011 2012
Empresas Ingreso Ingreso
Cantidad Cantidad
promedio promedio
A 118 160 185 150
B 145 215 222 227
c 75 80 126 310

(a) Los Índices de precios de Laspeyres y de Fisher no cumplen la propiedad


de inversión temporal en los años 2011 y 2012
(b) La variación porcentual del Índice de precios de Paasche en 2012 respecto
2011 es aproximadamente el 12,58%
(c) En 2012 el valor del índice de precios de Paasche es mayor que el de
Laspeyres
(d) Ninguna de las respuestas es verdadera

Solución: La opción (c).

Justificación: La opción (a) es falsa porque los Índices de precios de Fisher


cumplen la propiedad de inversión temporal en los años 2011 y 2012 como se
demuestra a continuación . La opción (b) es falsa porque la variación
porcentual del Índice de precios de Paasche en 2012 respecto a 2011 es
aproximadamente 58,67%, ya que las magnitudes del Índice de precios de
Paasche en 2012 y 2011 son respectivamente 158,6733 y 100 como se
comprueba a continuación. La opción ( c) es verdadera como se deduce de los
valores de los Índices de precios de Laspeyres y Paasche que se muestran en
la tabla adjunta. La opción (d) es falsa porque la opción (c) es verdadera.
SERIES TEMPORALES 163

Magnitudes aproximadas de los Índices de


precios
Índices
En 2012 con año base En 2011 con año base
2011 2012
Índice de Laspeyres 155,9361 63,0226
Índice de Paasche 158,6733 64,1288
Índice de Fisher 157,2987 63,5733

Cálculo: Las magnitudes de los sumatorios necesarios para calcular los índices
se muestran en la sig uiente tabla.

P¡( l l) • P¡(12) • Pi(ll) • Pi(12) •


Empresas
Q¡( l l) Q¡(ll) Qi(12) Qi(12)
A 18.880 29.600 17.700 27 .750
B 31.175 47.730 32.915 50 .394
e 6.000 10.080 23.250 39.060
Total de sumas 56.055 87.410 73.865 117.204

Índice de precios de Laspeyres.

IPL1211 = 87 .4IO· 100 :::::> IPL 11 = 155 936 1


1
"
56.055 ,

1 73 865 12
IPL ; = · · 100 :::::> IPL11 = 63 0226
l. 117.204 ,

Índice de precios de Paasche:

IPP. 2 =
JI
11 7 2 4
·
73.865
º· 100 :::::> IPP. 2 = 158 6733
JI '

1 56 055 1
/PP., = ·
)_ 87.4 10
. 100 :::::> / PP., = 64 1288
)_ ,

Índice de precios de Fisher:

/PF¡\2 = .J155,936 1· 158,6733 => / Pf¡\2 "' 157,2987


/Pf¡ 121 = .J63,0226·64, 1288 :::::> /Pf¡121 = 63,5733

Propiedad de inversión temporal:

Se cu mple la propiedad de inversión temporal en el caso que se verifique la


siguiente relación:
164 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

1' ¡ 11
1 .----12_ = 1
_1_1
100 100

Caso del índice de Laspeyres. 155,9361 x 63,0226 "" 0,9827 que es distinto de
1, luego no cumple la propiedad de inversión.

Caso del índice de Paasche: 158,6733 x 64,1288 "" 1,0176 que es distinto de 1,
luego no cumple la propiedad de inversión.

Caso del índice de Fischer. 157,2987 x 63,5733 ""' 1 luego sí cumple la


propiedad de inversión.

Variación porcentual del Índice de Precios de Paasche en 2012 respecto 2011:


Las variaciones o incrementos porcentuales de los precios entre el año t y el
t+ 1, se calculan comparando los números índice o las magnitudes de los
precios mediante la expresión siguiente:

En nuestro caso, con el año 2011 como base, el incremento del Índice de
precios de Paasche en 2012 respecto 2011 es:

0~'i x 1ooJ -100 = ( 158•6733 x 100) - 1oo ;:::58 67%


º = [ 1P.!
2
2 12
v:2011 /P!.º11 100 '
2011

El resultado es el mismo si empleamos otro método más sencillo consistente


en restar los correspondientes valores de los índices de cada año en la misma
base. Es decir, como el índice en base 2011 para el año 2011 es 100, habría
que restar 100 al índice del año 2012 en base 2011 para obtener la variación
porcentual entre el año base 2011 y el año 2012. Por ejemplo, con el año
2011 como base:

11201
V201 12-- /D201
í 201 12- ¡2011
2011-- 15 8,6 733 - I00 -- 58,67oYo

P.6.12. Se dispone de los datos siguientes sobre las magnitudes de


un número Índice en base 2006. Se realiza un cambio de base al año
2009. Indique cuál de las opciones siguientes es falsa.
SERIES TEMPORALES 165

Índice base
AÑO
2006
2006 100
2007 110
2008 114
2009 110
2010 120
2011 130

(a) El Índice del año 2007 en base 2009 es 100


(b) El Índice del año 2009 en base 2009 es 100
(c) La variación de los precios en el año 2009 respecto a 2008 es
aproximadamente igual a -3,51 %
(d) El Índice del año 2008 en base 2006 es menor que en base 2009
Solución: La opción ( d).

Justificación: La opción ( d) es falsa porque el Índice del año 2008 en base


2006 es mayor que en base 2009 cono se comprueba en la tabla adjunta,
donde se presentan las soluciones.

Indice Indice Variación


AÑO base base anual de
2006 2009 orecios (%)
2006 100 90,91
2007 110 100 10%
2008 114 103.64 3,64%
2009 110 100 -3,51 %
2010 120 109 09 9,09%
2011 130 118,18 8,33%

Cálculo: La forma de calcular los índices en la nueva base es la siguiente:


1
12009 = 1;006
;009
. -
x 100 ; Por e1emplo para el ano 2007:
1 2007
2009 =-11o x 100 = 100
12006 11 o

La forma de calcular las variaciones porcentuales de los índices de precios es


la siguiente:

l
~~¡ = ~~~~6 X 1ooJ - 100; Por ejemplo para el año 2009 respecto a 2008:
l/
2006

ºº = ¡ ;gg:
v:2008 x 1ooJ- 1oo = (J_!Q x i oo) - 1oo ~ - 3 si %
2 9
2008 114 ,
2006
166 EJERC ICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

P.6.13. En la tabla siguiente se muestra una serie de números índice,


desde 2008 a 2012, expresados en base 2008. Indique la opción
verdadera.

Índices
Años
con base 2008
2008 100
2009 120
2010 132
2011 143
2012 154

(a) La variación porcentual del índice entre 2009 y 2011 es aproximadamente


29, 17%
(b) El valor del índice para 2011 en base 2010 es aproximadamente 104,33
(c) El valor del índice para 2009 en base 2010 es aproximadamente 90,91
(d) Las opciones (a) y (c) son verdaderas

Solución: La opción (c).

Justificación: La opción (a) es falsa porque la variación porcentual del índice


entre 2009 y 2011 es aproximadamente 19,17%, como se demuestra a
continuación. La opción (b) es falsa porque el valor del índice para 2011 en
base 2010 es aproximadamente 108,33 como se comprueba en la tabla
adjunta, donde se presentan las soluciones. La opción (d) es falsa porque la
opción (a) es falsa.

AÑO Índices base 2008 Índice base 2010


2008 100 75,76
2009 120 90,91
2010 132 100,00
2011 143 108,33
2012 154 116,67

Cálculo: La forma de calcular los índices en la nueva base es la siguiente:


12101o = 1201 ~
1;008x 100 ;Porejemploparaelano2011: 12011
2010 =143X 100::::; 108' 33
0 132
2008

La forma de calcular las variaciones porcentuales de los índices de precios es


la siguiente:
SERIES TEMPORALES 167

l
~~1 = 1~~~ 8 x 100J- 1 00; Por ejemplo para el año 2011 respecto a 2009:
1
2008

.2º11 =
l!'2009 [ 1~g~~ x1ooJ-1 oo = ( 143
¡2009 120 x1oo)- 1oo¡:::19' 17%
2008

P.6.14. En la tabla siguiente se muestra la serie de ventas de una


empresa durante el periodo 2009-2012. Se supone una inflación
anual constante del 3,5°/o durante el período 2009-2012. Indique
cuál es la opción falsa. (Operar con EXCEL o con seis decimales, al
menos, en caso de calculadora)

Año Ventas
2009 430
2010 410
2011 380
2012 400

(a) La magnitud del deflactor en el año 2011 es aproximadamente 1,071


(b) La magnitud de las ventas deflactadas en el año 2010 es
aproximadamente 396,135
(c) La magnitud de las ventas deflactadas en el año 2012 es aproximadamente
351,991
(d) Las opciones (a) y (b) son verdaderas

Solución: La opción (c) .

Justificación: La opción (c) es falsa porque la magnitud de las ventas


deflactadas en el año 2012 es aproximadamente 360,777 como se muestra en
la tabla adjunta, donde se presentan los resultados obtenidos.

Ventas Deflactadas
Año Ventas Deflactor
(Ventas / deflactor)
2009 430 1 430
2010 410 1,035 396,135
2011 380 1,071 354,734
2012 400 1, 109 360,777
168 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Cálculo:

Para obtener el deflactor de cada año tenemos que operar de la siguiente


forma:

0,. 1 = 0 ,(1 + 0,035)

Teniendo en cuenta que el deflactor del primer año es 1, obtendríamos las


magnitudes de los demás deflactores que se muestran en la tabla adjunta. Por
ejemplo, para el año 2010:

0 2010 = D200il + 0,035)= 1x 1,035=1.035

Asimismo, para obtener la magnitud de las ventas deflactadas, se divide el


valor de las ventas por el deflactor correspondiente al mismo año, Por
ejemplo, para el año 2012:
VD 'OP = v; Ol 2 = 400 '=" 360, 777
- - D2012 1, 109
SERIES TEMPORALES 169

CAPÍTULO 7. SERIES TEMPORALES

7 .1. Preguntas Teóricas

T.7.1. En relación con los componentes de una serie temporal,


indique cuál de las opciones siguientes es verdadera.

(a) El factor cíclico recoge las oscilaciones de carácter periódico, pero no


regular, y se considera que el periodo de cada ciclo siempre es inferior al
año
(b) La estacionalidad recoge las oscilaciones a medio plazo, entendiendo como
tales aquellas cuya duración es superior a un año
(c) Las razones de las fluctuaciones irregulares son de tipo físico-natura l
(tiempo meteorológico, ciclos biológicos, etc.) o de tipo institucional
(vacaciones escolares, fiestas, horarios comerciales, etc.)
(d) La tendencia de una serie temporal es el componente que ind ica la
dirección en la que se mueve la serie en el largo plazo

Solución: La opción (d).

Justificación: La opción (a) es falsa porque el factor cíclico de una serie


temporal recoge las oscilaciones de carácter periódico, pero no regular, y a
medio plazo; se considera que el periodo de cada ciclo siempre es superior al
año. La opción (b) es falsa porque la estacionalidad recoge las oscilaciones a
corto plazo, entendiendo como tales aquellas cuya duración es igual o inferior
a un año. La opción ( c) es falsa porque las fluctuaciones irregulares se
producen con motivo de un acontecimiento especial y ocasional concreto; una
vez extraídos los anteriores componentes (tendencia, estacionalidad y ciclo)
suele quedar este componente derivado de movimientos irregulares,
ocasionales o aleatorios.

T.7.2. indique cuál de las opciones siguientes es falsa.

(a) El método de los semipromedios para el análisis de la tendencia sólo es


válido para los ajustes de tipo lineal
(b) Los métodos clásicos de análisis de la tendencia son tres: los
semipromedios, los ajustes de una función por mínimos cuadrados y el
método de los promedios (o medias) móviles.
(c) Respecto a los ajustes por mínimos cuadrados para el análisis de la
tendencia, no se puede utilizar la función de tendencia exponencia l.
(d) Los medios más utilizados para detectar y eliminar la tendencia de una
serie se basan en la aplicación de filtros a los datos
170 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Solución: La opción (c).

Justificación: La opción (c) es falsa porque respecto a los ajustes por mínimos
cuadrados, las funciones de tendencia más utilizadas son: lineal, polinómica y
exponencia 1.

T.7.3. Indique cuál de las opciones siguientes es falsa.

(a) Los principales inconvenientes del método de la media móvil para el


cálculo de la tendencia son su poca flexibilidad y la dificultad de su cálculo
(b) El método de los semi promedios para el cálculo de la tendencia requiere
dividir la serie de datos en dos mitades y calcular el promedio de cada
mitad que se centra en el punto medio. La recta que una ambas medias (o
semipromedios) sería la línea de tendencia estimada
(c) En el caso del método de la media móvil para el cálculo de la tendencia, si
la periodicidad es de tres términos se pierden dos datos
(d) Un inconveniente del método de la media móvil para el cá lcu lo de la
tendencia corresponde a la decisión, que es relativamente arbitraria, del
número de periodos utilizados para calcularla y la variabilidad que ello
conlleva

Solución: La opción (a).

Justificación: La opción (a) es falsa porque las ventajas que tiene la media
móvil son la flexibilidad y la facilidad de cálculo. Los principales inconvenientes
son: a) La pérdida de información; de la tendencia en los ejercicios inicial y
final (en el caso de media móvil con periodicidad de tres términos se han
perdido dos datos, el primero y el último, pero en el caso de medias móviles
con mayor periodicidad perderíamos más información); b) La decisión, que es
relativamente arbitraria, del número de periodos utilizados para calcularla y la
variabilidad que ello conlleva, ya que los datos obtenidos con una media móvil
de 3 períodos son bastante diferentes de la media para la misma serie pero
con 5 períodos de cálculo.

T.7.4. Indique cuál de las opciones siguientes es falsa.

(a) Un ciclo tiene dos componentes básicos: la amplitud o la distancia que


media entre el cero y el máximo valor que alcanza el ciclo, y el periodo o el
tiempo que tarda en ocurrir un ciclo completo
(b) El método del porcentaje promedio es un procedimiento rápido y simple
para elaborar un índice estacional pero tiene el inconveniente de que al
utilizarse medias móviles, se produce una pérdida de información
correspondiente al número de periodos por año considerados, en el caso
trimestral dos en el inicio y dos en el final
SERIES TEMPORALES 171

(c) Desestacionalización es el procedimiento de descontar los efectos que


provoca la existencia de un ciclo estacional
(d) Las variaciones estacionales corresponden a los ciclos regulares de
duración inferior al año

Solución: La opción (b).

Justificación: La opción (b) es falsa porque en el método del porcentaje


promedio no se utilizan medias móviles y por tanto no se pierde información.

T.7.5. Indique cuál de las siguientes opciones es verdadera.

(a) En el caso de media móvil con periodicidad de cinco términos se pierden


cinco datos
(b) Si se elige un número par de datos en la media móvil, no se puede llevar a
cabo el método de las medias móviles
(c) Las variaciones estacionales corresponden a los ciclos regulares de
duración superior al año
(d) Todas las respuestas son falsas

Solución: La opción (d).

Justificación: La opción (a) es falsa porque en el caso de media móvil con


periodicidad de cinco términos se pierden cuatro datos, los dos primeros y los
dos últimos. La opción (b) es falsa porque el método de las medias móviles se
puede llevar a cabo si se elige un número par de datos en la media móvil, y
siendo el número par, lo más correcto es imputarlo a la primera referencia de
las dos fechas centrales. La opción (c) es falsa porque las variaciones
estacionales corresponden a las oscilaciones a corto plazo, entendiendo como
tales aquellas cuya duración es igual o inferior a un año.

T.7.6. En relación con las series temporales, indique cuál de las


siguientes opciones es falsa.

(a) Las variaciones estacionales se estudian mediante los denominados


procedimientos de desestacionalización, siendo los más sencillos y
utilizados el método del porcentaje promedio y el método del porcentaje
promedio móvil.
(b) Los principales inconvenientes de utilizar medias móviles para calcular una
tendencia son la pérdida de información y la arbitrariedad que conlleva
este método de ajuste.
(c) El cálculo de la tendencia por el método de los semipromedios no es posible
(d) Las opciones (a) y (b) son verdaderas
172 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Solución: La opción (c).

Justificación: La opción ( c) es falsa porque el método de los semipromedios es


uno de los métodos utilizables para el cálculo de la tendencia.

T.7.7. En relación con el estudio de series temporales, indique cuál de


las siguientes opciones es verdadera.

(a) Los métodos clásicos de análisis de la tendencia son los semipromed ios,
los ajustes de una función por mínimos cuadrados y el método de los
promedios (o medias) móviles.
(b) Los métodos habituales de análisis de las variaciones estacionales son los
semipromedios, los ajustes de una función por míni mos cuadrados y el
método de los promedios (o medias) móviles.
(c) Los suavizados exponenciales son métodos dirigidos a eliminar los ciclos y
las variaciones estacionales de las series.
(d) Ninguna de las anteriores opciones es verdadera

Solución: La opción (a).

Justificación: La opción (b) es falsa porque los métodos habituales de análisis


de las variaciones estacionales son: el método del porcentaje promedio y el
método del porcentaje promedio móvil. La opción (c) es falsa porque los
suavizados exponenciales son métodos dirigidos a eliminar la fluctuación
aleatoria . Esto permite captar cualquier "patrón" de conducta que sea evidente
en la serie temporal observada, y usar ese patrón para predecir los nuevos
valores. La opción (d) es falsa porque la opción (a) es verdadera.

T.7.8. Como procedimiento de desestacionalización se calculan los


promedios o medias móviles centradas de una serie temporal
mensual que abarca desde el año 2010 hasta el 2013 (2013
incluido). Indique cuál de las siguientes opciones es verdadera.

(a) El número de medias móviles centradas obtenidas serán 24.


(b) El número de medias móviles suavizadas obtenidas serán 18.
(c) El número de medias móviles centradas obtenidas será 36.
(d) Las opciones (a) y (c) son verdaderas.

Solución: La opción (c).


SERIES TEMPORALES 173

Justificación: Las opciones (a) y (b) son falsas porque al utiliza rse medias
móviles, se produce una pérdida de información correspondiente al número de
periodos por año considerados, en nuestro caso, seis en el inicio de la serie y
seis en el final, es decir, el número de medias móviles centradas obtenidas
será 36. La opción (d) es falsa porque la opción (a) es falsa.

T.7.9. Dada una serie cuyo periodo es de dos años, indique cuál de
las siguientes opciones es verdadera.

(a) No tiene componente estacional


(b) Se ajusta siempre al esquema multiplicativo
( c) Carece de ciclo
( d) Ninguna de las anteriores es verdadera

Solución: La opción (a).

Justificación: La opción (b) es falsa porque la asoc1ac1on de las cuatro


componentes en la serie temporal (Y) puede ser Aditiva : Y = T + C + S + I.
La opción (c) es falsa porque se entiende por componente o variación cíclica
las va riaciones regulares que se producen en las series temporales con
periodo superior a un año. La opción (d) es falsa porque la opción (a) es
verdadera.

T.7.10. En relación con las variaciones cíclicas e irregulares de una


serie, indique cuál de las siguientes opciones es verdadera.

(a) Las variaciones cíclicas e irregulares de una serie son las que tienen una
periodicidad menor de un año
(b) En teoría, cabe entender una serie temporal como una suma de un
número indeterminado de ciclos de amplitud y período diferentes, y puede
demostrarse que la varianza que muestra en el tiempo una serie temporal
se obtiene a partir de la suma de las amplitudes de los diferentes ciclos en
que se descompone la serie temporal
(c) Las variaciones cíclicas e irregulares de una serie recogen ciclos que tienen
un solo componente básico: la amplitud o la distancia que media entre el
cero y el máximo valor que alcanza el ciclo
(d) Ninguna de las opciones planteadas es cierta

Soluo6n: La opción (b).

Justificao6n: La opción (a) es falsa porque las variaciones cíclicas e irregulares


de una serie son las que tienen una periodicidad mayor de un año. La opción
(c) es falsa porque las variaciones cíclicas e irregulares de una serie recogen
174 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

ciclos que tiene dos componentes básicos : la amplitud o la distancia que


media entre el cero y el máximo valor que alcanza el ciclo, y el periodo o el
tiempo que tarda en ocurrir un ciclo completo. La opción (d) es falsa porque la
opción (b) es verdadera.

T.7.11. Indique cuál de las siguientes afirmaciones es verdadera.

(a) El análisis o modelado tradicional de una serie temporal se basa en


considerar que la misma puede dividirse en tres componentes
diferenciadas, llamadas tendencia, fluctuación cíclica y movimientos
irregulares.
(b) Desestacionalizar una serie consiste en eliminar las variaciones a largo
plazo .
(c) La tendencia es una componente de la serie temporal que refleja su
evolución y comportamiento a largo plazo.
(d) La componente o variación cíclica corresponde a las variaciones regulares
que se producen en las series temporales con periodo inferior a un año.

Solución: La opción (c).

Justificación: La opción (a) es falsa porque el análisis o modelado tradicional


de una serie temporal se basa en considerar que la misma puede dividirse en
cuatro componentes diferenciadas, llamadas tendencia, fluctuación cíclica,
variación estacional y movimientos irregulares. La opción (b) es falsa porque
desestacionalizar una serie consiste en el procedimiento de descontar los
efectos que provoca la existencia de un ciclo estacional. La opción (d) es falsa
porque se entiende por componente o variación cíclica a las variaciones
regulares que se producen en las series temporales con periodo superior a un
año.

T.7.12. El método de las medias móviles es una técnica que:

(a) Calcula la tendencia mediante la recta que une las dos medias (o
semipromedios) de las dos mitades en que se divide la serie de datos
(b) Es una buena técnica para eliminar el componente cíclico de una serie
(c) Calcula la tendencia sin necesidad de ajustar una función previa
(d) Ninguna de las anteriores es cierta

Solución: La opción (c).

Justificación: Las opciones (a) y (b) son falsas porque el método de las medias
móviles es una técnica para calcular tendencias sin tener que ajustarnos a una
función previa . Una media móvil es un promedio de un número determinado
de datos, u orden de la media móvil, que se imputa siempre a la fecha central
SERIES TEMPORALES 175

si se elige un número impar de datos; sí el número es par, lo más correcto es


imputarlo a la primera referencia de las dos fechas centrales. La opción (d) es
falsa porque la opción (c) es verdadera.

T.7.13. En el cálculo de la tendencia por el método de las medias


móviles, empleando tres observaciones, se pierden:

(a) Cuatro observaciones


(b) Dos observaciones
(c) Tres observaciones
(d) Ninguna de las respuestas es correcta

Solución: La opción (b).

Justificación: Las opciones (a) y (c) son falsas porque en el cálcu lo de la


tendencia por el método de las medias móviles, empleando tres observaciones
se han perdido dos datos, el primero y el último. La opción (d) es falsa porque
la opción (b) es verdadera.

T.7.14. El método de las medias móviles es una técnica que:

(a) Calcula la tendencia en los ajustes de tipo lineal


(b) Calcula la tendencia sin necesidad de ajustar una función previa
( c) Tiene la ventaja de no producirse pérdida de información al aplicar dicho
método
(d) Ninguna de las anteriores es cierta

Solución: La opción (b ).

Justificación: La opción (a) es falsa porque el método de las medias móviles es


una técnica para calcular tendencias sin tener que ajustarnos a una función
previa. Una media móvil es un promedio de un número determinado de datos,
u orden de la media móvil, que se imputa siempre a la fecha central si se elige
un número impar de datos; sí el número es par, lo más correcto es imputarlo
a la primera referencia de las dos fechas centrales. La opción ( c) es falsa
porque la media móvil tiene el inconveniente de la pérdida de información ya
que se pierde información de la tendencia en los ejercicios inicial y final (en el
caso de media móvil con periodicidad de tres términos se han perdido dos
datos, el primero y el último). La opción (d) es falsa porque la opción (b) es
verdadera.
176 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.7.15. El método del porcentaje promedio se utiliza para elaborar un


índice estacional, que se supone de carácter:

(a) Aditivo
(b) Multiplicativo
(c) Tanto aditivo como multiplicativo
(d) Ninguna de las anteriores es cierta

Solución: La opción (b).

Justificación: Las opciones (a) y (c) son falsas porque el método del
porcentaje promedio es un procedimiento para elabora r un índice estacional,
que se supone de carácter multiplicativo. La opción (d) es falsa porque la
opción (b) es verdadera.

T.7.16. Indique cuál de las siguientes opciones es falsa.

(a) El método de las medias móviles se utiliza para la determinación de la


tendencia.
(b) En el factor cíclico se considera que el periodo de cada ciclo siempre es
inferior al año
(c) Sí el número de datos de la media móvil es par, lo más correcto es imputar
el orden de la media móvil a la primera referencia de las dos fechas
centrales
( d) Las respuestas (a) y ( c) son verdaderas

Solución: La opción (b ).

Justificación: La opción (b) es falsa porque se entiende por componente o


variación cícl ica las variaciones regulares que se producen en las series
temporales con periodo superior a un año.

T.7.17. Indique cuál de las opciones siguientes es verdadera.

(a) El propósito del método del Alisado o Suavización Exponencial es eliminar


la flu ctuación aleatoria. Esto permite captar cualquier "patrón" de conducta
que sea evidente en la serie temporal observada
(b) El método del Alisado o Suavización Exponencial no se utiliza para
predicción
(c) El método del Alisado o Suavización Exponencial se utiliza para la
desestacionalización de la serie mediante el procedimiento de descontar
los efectos que provoca la existencia de un ciclo estacional
(d) El único componente de un ciclo es el periodo o el tiempo que tarda en
ocurrir un ciclo complet o
SERIES TEMPORALES 177

Solución: La opción (a).

Justificación: La opción (b) es falsa porque el método del Alisado Exponencial


permite captar cualquier "patrón" de conducta que sea evidente en la serie
temporal observada, y usar ese patrón para predecir los nuevos valores. La
opción (c) es falsa porque el método de Alisado Exponencial se utiliza para
eliminar la fluctuación aleatoria. La opción (d) es falsa porque un ciclo tiene
dos componentes básicos: la amplitud o la distancia que media entre el cero y
el máximo valor que alcanza el ciclo, y el periodo o el tiempo que tarda en
ocurrir un ciclo completo.

T.7.18. El método del suavizado exponencial simple se utiliza para


modelizar series:

(a) Estacionarias, es decir, sin tendencia


(b) Con tendencia lineal sin componente estacional
(c) Con tendencia lineal y componente estacional
(d) Con tendencia exponencial y componente estacional

Solución: La opción (a) .

Justificación: Las opciones (b), (c) y (d) son falsas porque el método del
suavizado exponencial simple se utiliza cuando la serie presenta un
comportamiento estacionario, es decir, no tiene tendencia.

T.7 .19. El método del suavizado exponencial de Holt se utiliza para


modelizar series:

(a) Estacionarias, es decir sin tendencia


(b) Con tendencia lineal y sin componente estacional
(c) Con tendencia lineal y componente estacional
(d) Con tendencia exponencial y componente estacional

Solución: La opción (b) .

Justificación: Las opciones (a), (c) y (d) son falsas porque el método del
suavizado exponencial de Holt se utiliza cuando la serie presenta tendencia
lineal, creciente o decreciente, y puede ser modelizada como: Xt = a + bt +
Ut; con t = 1, 2, .... , T; donde Ut sería la fluctuación irregular. Es decir no tiene
componente estacional.
178 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.7.20. El suavizado exponencial de Winters se utiliza para modelizar


series:

(a) Estacionarias, es decir sin tendencia


(b) Con tendencia lineal y sin componente estacional
(c) Con tendencia lineal y componente estacional
(d) Con tendencia exponencial y componente estacional

Solución: La opción ( c)

Justificación: Las opciones (a), (b) y (d) son falsas porque el método del
suavizado exponencial de Winters se utiliza para modelizar series con
tendencia lineal y patrón estacional multiplicativo.
SERIES TEMPORALES 179

7. 2. Problemas

P.7.1. A partir de los siguientes datos sobre la evolución de las


ventas t rimestrales de una empresa en miles de euros, est ime la
tendencia por el método de los semipromedios, basados en la media
aritmética, e indique cuál de las opciones siguientes es verdadera.

Año Trimestre Ventas (Miles de Euros)


2009 1 4000
2009 2 4080
2009 3 4110
2009 4 4500
2010 1 4308
2010 2 4460
2010 3 4298
2010 4 4720
2011 1 4740
2011 2 4680
2011 3 4490
2011 4 4920
2012 1 4680
2012 2 4902
2012 3 4700
2012 4 5166

(a) El dato de la tendencia, correspondiente al cuarto trimestre del año 2011


es aproximadamente 4.665 (Miles de Euros)
(b) El dato de la tendencia, correspondiente al cuarto trimestre del año 2011
es aproximadamente 4.955 (Miles de Euros)
(c) El dato de la tendencia, correspondiente al cuarto trimestre del año 2011
es aproximadamente 4.755 (Miles de Euros)
(d) Ninguna de las anteriores es verdadera.

Solución: La opción (c).

Justificación: Como se muestra en la tabla adjunta, donde se presentan los


resu ltados de la tendencia estimada por el método de los semipromedios, las
opciones (a) y (b) son falsas porque el valor de la tendencia estimada por el
método de los semipromedios, correspondiente al cuarto trimestre del año
180 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

2011, es aproximadamente 4.755 (Miles de Euros). La opción (d) es falsa


porque la opción (c) es verdadera.

Ventas Tendencia
Año Trimestre
(Miles de Euros) (Miles de Euros
2009 1 4000 4102
2009 2 4080 4161
2009 3 4110 4220
2009 4 4500 4280
2010 1 4308 4339
2010 2 4460 4399
2010 3 4298 4458
2010 4 4720 4517
2011 1 4740 4577
2011 2 4680 4636
2011 3 4490 4696
2011 4 4920 4755
2012 1 4680 4814
2012 2 4902 4874
2012 3 4700 4933
2012 4 5166 4993

Cálculo: A continuación se describe el proceso de cálculo de la tendencia


estimada por el método de los semipromedios, basados en la media.

Dividimos la serie en dos mitades, cada una de 8 trimestres y calculamos los


promedios de cada mitad.

.
Pr omedto
_40_00_+_4_08_0_+_
.......
_ _..._.. +_4_29_8_+_
47_20 = 4.J'09 <
iooi;1010 = ,.,
8
.
Pr omed!O ~010-1012 =
4740 +4680 + ............. +4700 +5 166 =478475
8 ,

El primer semipromedio se centra entre el cuarto trimestre de 2009 y el


primero de 2010 Cxt = 4,5) y el segundo entre el cuarto de 2011 y el primero
de 2012 (Xt = 12,5).

La tendencia se obtiene calculando una línea recta: Yt = a + bxa donde los


valores de Xt se elaboran a partir de una sucesión de puntuaciones
consecutivas, que van desde un mínimo 1 en el primer trimestre de 2009
SERIES TEMPORALES 181

hasta un máximo de 16 en el cuarto trimestre de 2012; el coeficiente de la


pendiente de la recta b representaría por tanto el incremento trimestral de la
tendencia, disponiéndose para poder estimar los parámetros a y b, de los
puntos correspondientes a los dos semipromedios, es decir:

Xt = 4,5; Yt = 4309,5
Xt = 12,5; Yt = 4784,75

El coeficiente b se calcula a partir de los dos semipromedios del siguiente


modo:

b= 4784,75 - 4309,5 "'594063


8 ,

Por tanto, se estima un incremento medio de las ventas de 59,4063 miles de


euros al trimestre, aproximadamente. El valor de a se puede obtener
considerando cualquiera de los dos puntos; por ejemplo, considerando el
segundo semipromedio:

8 = 4.784,75 - 12,5·59,4 1"' 4042, 17

Siendo, por tanto, la ecuación de la tendencia :

Yt = 4042,17 + 59,41xt, con Xt =1,2, ....,16

Se muestra en la siguiente tabla los valores de la línea de tendencia calculada.


182 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Serie Original Yt (Valores de la Tendencia


Año Trimestre Xt
(Miles de Euros) en Miles de Euros
2009 1 4000 1 4102
2009 2 4080 2 4161
2009 3 4110 3 4220
2009 4 4500 4 4280
2010 1 4308 5 4339
2010 2 4460 6 4399
2010 3 4298 7 4458
2010 4 4720 8 4517
2011 1 4740 9 4577
2011 2 4680 10 4636
2011 3 4490 11 4696
2011 4 4920 12 4755
2012 1 4680 13 4814
2012 2 4902 14 4874
2012 3 4700 15 4933
2012 4 5166 16 4993

P.7.2. A partir de los siguientes datos sobre la evolución del coste


anual salarial por trabajador de una empresa en miles de euros,
utilice el método de los semipromedios para determinar la tendencia
lineal de dicha serie, tomando a la media como promedio. Indique
cuál de las opciones siguientes es verdadera.

2005 2006 2007 2008 2009 2010 2011 2012


12 15 18 15 13 12 15 20

(a) El dato de la tendencia correspondiente al año 2012 es mayor que el


correspondiente al año 2010
(b) El dato de la tendencia correspondiente al año 2010 es mayor que el
correspondiente al año 2012
(c) El dato de la tendencia correspondiente al año 2008 es aproximadamente
15 (Miles de Euros)
(d) Ninguna de las anteriores es verdadera.

Soluo6n: La opción (e) .


SERIES TEMPORALES 183

Justificación: Como se muestra en la tabla adjunta, donde se presentan los


resultados de la tendencia estimada por el método de los semipromedios, las
opciones (a) y (b) son falsas porque el dato de la tendencia estimada por el
método de los semipromedios, correspondiente a los años 2010 y 2012 es el
mismo (15 Mil Euros). La opción (d) es falsa porque la opción (c) es
verdadera.

Coste salarial por trabajador Tendencia


Año
(Miles de Euros) (Miles de Euros
2005 12 15
2006 15 15
2007 18 15
2008 15 15
2009 13 15
2010 12 15
2011 15 15
2012 20 15

Cálculo: A continuación se describe el proceso de cálculo de la tendencia


estimada por el método de los semipromedios, basados en la media.

Dividimos la serie en dos mitades, cada una de 4 años y calculamos los


promedios de cada mitad.

. 12+ 15 + 18 + 15
Promedio'""'
- •-00, = 4 =15
. 13 + 12 + 15+20 -
Promed10 • 00~, 111 • = = 1)
- - - 4

El primer semipromedio se centra entre 2006 y 2007 (xt = 2,5) y el segundo


entre 2010 y 2011 (xt = 6,5).

La tendencia se obtiene calculando una línea recta: Yt = a + bxt, donde los


valores de Xt se elaboran a partir de una sucesión de puntuaciones
consecutivas, que van desde un mínimo 1 en 2005 hasta un máximo de 8 en
2012; el coeficiente de la pendiente de la recta b representaría por tanto el
incremento anual de la tendencia, disponiéndose para poder estimar los
parámetros a y b, de los puntos correspondientes a los dos semi promedios, es
decir:

Xt = 2,5; Yt = 15
Xt = 6,5; Yt = 15
184 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

El coeficiente b se calcula a partir de los dos sem ipromedios del siguiente


modo:
b = 15 - 15 = Ü
4

Por tanto, se estima un incremento anual nulo del salario. El valor de a se


puede obtener considerando cualquiera de los dos puntos; por ejemplo,
considerando el segundo semipromedio:

a= 15 - 6,5·0 = 15

Siendo, por tanto, la ecuación de la tendencia:

Yt = 15, con Xt =1,2, ... .,8


Se muestra en la siguiente tabla los valores de la línea de tendencia calculada.

Yt(Valores de la
Serie Original
Año Xt Tendencia en
(Miles de Euros)
Miles de Eu ros
2005 12 1 15
2006 15 2 15
2007 18 3 15
2008 15 4 15
2009 13 5 15
2010 12 6 15
2011 15 7 15
2012 20 8 15

P.7.3. A partir de los siguientes datos sobre la evolución de costes


anuales de una empresa en miles de euros, utilice el método de los
semipromedios para determinar la tendencia lineal de dicha serie,
tomando a la mediana como promedio. Indique cuál de las opciones
siguientes es verdadera. (Para simplificar los cálculos, omita el año
central)

2006 2007 2008 2009 2010 2011 2012


191 204 205 208 211 213 230
SERIES TEMPORALES 185

(a) El dato de la tendencia, correspondiente al 2011, es 214 (Miles de Euros)


(b) El dato de la tendencia, correspondiente al año 2008, es 206,25 (Miles de
Euros)
(c) El dato de la tendencia, correspondiente al año 2012 es 217,25 (Miles de
Euros)
(d) Ninguna de las anteriores es verdadera.

Solución: La opción (b).

Justificación: Como se muestra en la tabla adjunta, donde se presentan los


resultados de la tendencia estimada por el método de los semipromedios, la
opción (a) es falsa porque el dato de la tendencia estimada por el método de
los semipromedios, correspondiente al año 2011, tomando a la mediana como
promedio, es 213 (Miles de Euros). La opción (c) es falsa porque el dato de la
tendencia estimada por el método de los semipromedios, correspondiente al
año 2012, tomando a la mediana como promedio, es 215,25 (Mi les de Euros).
La opción (d) es falsa porque la opción (b) es verdadera.

Costes Tendencia
Año
(Miles de Euros (Mi les de Euros
2006 191 201,75
2007 204 204
2008 205 206,25
2009 208 208,50
2010 211 210,75
2011 213 213
2012 230 215,25

Cálculo: A continuación se describe el proceso de cálculo de la tendencia


estimada por el método de los semipromedios, basados en la mediana. En
primer lugar, debe dividi rse la serie en dos partes iguales y se calcula la
mediana de cada parte por separado. Para simplificar los cálcu los, se omite el
año central (2009). Con estos datos pueden calcu larse la pendiente y
ordenada al origen de una recta tendencia!. Por último, se utiliza la ecuación
hallada para determinar los valores de la tendencia. En nuestro caso dividimos
la serie en dos mitades, cada una de 3 años y ca lculamos las medianas de
cada mitad. Como los valores de la serie están ya ordenados no hace falta
ordenar la serie de menor a mayor para calcular las dos medianas, por lo que
las medianas a considerar son la segunda y la sexta observación, que son
respectivamente 204 y 213 (Miles de Euros). El primer semipromedio se
centra en 2007 (xt = 2) y el segundo en 2011 (xt = 6) .
186 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Mediana 200., 2110 s = 204 (Miles de Euros)


Mediana 200
9-
2012
= 2 13 (Miles de Euros)

La tendencia se obtiene calculando una línea recta: Yt = a + bxt, donde los


valores de Xt se elaboran a partir de una sucesión de puntuaciones
consecutivas, que van desde un mínimo 1 en 2006 hasta un máximo de 7 en
2012; el coeficiente de la pendiente de la recta b representaría por tanto el
incremento anual de la tendencia, disponiéndose para poder estimar los
parámetros a y b, de los puntos correspondientes a los dos semipromedios, es
decir:

Xt = 2; Yt = 204 (Miles de Euros)


Xt = 6; Yt = 213 (Miles de Euros)

El coeficiente b se calcula a partir de los dos semipromedios del siguiente


modo:
213-204
b= = 2,25 (Miles de Euros)
4
Por tanto, se estima un incremento anual nulo de 2,25 (Miles de Euros). El
valor de a se puede obtener considerando cualquiera de los dos puntos; por
ejemplo, considerando el primer semipromed io:

a = 204-2·2,25 = 199, SO(Miles de Euros)

Siendo, por tanto, la ecuación de la tendencia:

Yt = 199,50 + 2,25xt, con Xt =1,2, .... 7 (Miles de Euros)

Se muestran en la siguiente tabla los valores de la línea de tendencia


calculada.
SER IES TEMPORALES 187

Serie Serie Original


Yt (Valores de la
Original ordenada Semi promedios
Año Xt Tendencia en
(Miles de (Mi les de (Medianas)
Miles de Euros
Euros) Euros)
2006 191 191 1 201,75
2007 204 204 2 204 204
2008 205 205 3 206,25
2009 208 208 4 208,50
2010 211 211 5 210,75
2011 213 213 6 213 213
2012 230 230 7 215,25

P.7.4. A partir de los siguientes datos sobre la evolución de los costes


anuales de una empresa en miles de euros, utilice el método de los
semipromedios para determinar la tendencia lineal de dicha serie,
tomando a la media y la mediana como promedios. Indique cuál de
las opciones siguientes es falsa. {Para simplificar los cálculos, omita
el año central)

2006 2007 2008 2009 2010 2011 2012


191 204 205 208 211 213 230

(a) En 2011, el valor de la tendencia, tomando a la media como promedio es


mayor que el valor de la tendencia tomando a la mediana como promedio
(b) En 2010, el valor de la tendencia, tomando a la media como promedio es
mayor que el valor de la tendencia tomando a la mediana como promedio
(c) En 2012, el valor de la tendencia, tomando a la media como promed io es
mayor que el valor de la tendencia tomando a la mediana como promedio
(d) En 2008, el valor de la tendencia, tomando a la media como promed io es
mayor que el valor de la tendencia tomando a la mediana como promedio

Solución: La opción (d).

Justificación: Como se muestra en la tabla adjunta, donde se presentan los


resultados de la tendencia estimada por el método de los semipromedios, la
opción (d) es falsa porque en 2008, el va lor de la tendencia, tomando a la
media como promedio (204,5) es menor que el valor de la tendencia tomando
a la media na como promedio ( 206,25).
188 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Tendencia (tomando Tendencia (tomando


Costes
a la media como a la mediana como
Año (Mi les de
promedio) promedio)
Euros)
(Mi les de Euros) (Miles de Euros)
2006 191 195,50 201,75
2007 204 200 204
2008 205 204,50 206,25
2009 208 209 208,50
2010 211 213,50 210,75
2011 213 218 213
2012 230 222,50 215,25

Cálculo: A continuación se describe el proceso de cálculo de la tendencia


estimada por el método de los semipromedios, basados en la media y en la
mediana.

1) Caso de cálculo de la tendencia estimada por el método de los


semipromed1os1 basados en la media:

Para calcular la tendencia por el método de los semipromedios, basados en la


media, dividimos la serie en dos mitades, cada una de cada una de 3 años, al
omitir el año 2009, y calcu lamos los promedios de cada mitad.

. 191 + 204 + 205


Promed10 200s- 2008 = = 200
3
. 211 + 213 + 230
Promedio 2009_20 12 = = 218
3

El primer semipromedio se centra en 2007 (xt =


2) y el segundo en 2011 (xt
= 6). La tendencia se obtiene calculando una línea recta : Yt = a + bxt1 donde
los valores de Xr se elaboran a partir de una sucesión de puntuaciones
consecutivas, que van desde un mínimo 1 en el primer trimestre de 2009
hasta un máximo de 16 en el cuarto trimestre de 2012; el coeficiente de la
pendiente de la recta b representaría por tanto el incremento anual de la
tendencia, disponiéndose para poder estimar los parámetros a y b, de los
puntos correspondientes a los dos semipromedios, es decir:

Xt = 2; Yt = 200
Xt = 6; Yt = 218

El coeficiente b se calcula a partir de los dos semipromedios del sigu iente


modo:
SERIES TEMPORALES 189

b = 21 8 - 200 = 4 50
4 '
Por tanto, se estima un incremento medio de las ventas de 4,50 miles de
euros al año. El valor de a se puede obtener considerando cualquiera de los
dos puntos; por ejemplo, considerando el primer semipromedio:

a=200 - 2. 4,5 = 191

Siendo, por tanto, la ecuación de la tendencia:

Yt = 191 + 4,50xt, con Xt =1,2, .. .. ,7


Se muestra en la siguiente tabla los valores de la línea de tendencia calculada.

Yt (Valores de la
Serie Original Semi promedios
Año Xt Tendencia en
(M iles de Euros) (Medias)
Miles de Euros
2006 191 1 195,50
2007 204 2 200 200,00
2008 205 3 204,50
2009 208 4 209,00
2010 211 5 213,50
2011 213 6 218 218,00
2012 230 7 222,50

2) Caso de cálculo de la tendencia estimada por el método de los


semipromedios, basados en la mediana:

Para calcular la tendencia por el método de los semipromedios, basados en la


mediana, dividimos la serie en dos partes iguales y se calcula la mediana de
cada parte por separado. Para simplificar los cálculos, se omite el año central
(2009). Con estos datos puede calcularse la pendiente y ordenada al origen de
una recta tendencia!. Por último, se utiliza la ecuación hallada para determinar
los valores de tendencia. En nuestro caso dividimos la serie en dos m itades,
cada una de 3 años y calculamos las medianas de cada mitad. Como los
valores de la serie están ya ordenados no hace falta ordenar la serie de menor
a mayor para calcular las dos medianas, por lo que las medianas a considerar
son la tercera y la novena observación, que son respectivamente 204 y 213
(Miles de Euros). El primer semipromedio se centra en 2007 (xt = 2) y el
segundo en 2011 (xt = 6).
190 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Mediana~ºº" ~ºº'= 204 (Miles de Euros)


Mediana 2009. 2012 = 213 (Miles de Euros)

La tendencia se obtiene calculando una línea recta: Yt = a + bxt, donde los


va lores de x1 se elaboran a partir de una sucesión de puntuaciones
consecutivas, que van desde un mínimo 1 en 2006 hasta un máximo de 7 en
2012; el coeficiente de la pendiente de la recta b representaría por tanto el
incremento anual de la tendencia , disponiéndose para poder estimar los
parámetros a y b, de los puntos correspondientes a los dos semipromedios, es
decir:
Xt = 2; y1 = 204 (Miles de Euros)
x1 = 6; Yt = 213 (Miles de Euros)

El coeficiente b se calcula a partir de los dos semipromedios del siguiente


modo:

213- 204 .
b= = 2.25 (Mi les de Euros)
4
Por tanto, se estima un incremento anual nulo de 2,25 (Miles de Euros). El
valor de a se puede obtener considerando cualquiera de los dos puntos; por
ejemplo, considerando el primer semipromedio:

8 = 204 - 2- 2,25= 199,SO (Miles de Euros)

Siendo, por tanto, la ecuación de la tendencia:

Yt = 199,50 + 2,25xt, con Xt = 1,2, .... 7 (Miles de Euros)

Se muestra en la siguiente tabla los valores de la línea de tendencia calcu lada.

Serie Serie Original


Yt (Va lores de la
Original ordenada Semi promedios
Año Xt Tendencia en
(Miles de (Miles de (Medianas)
Miles de Euros
Euros) Euros)
2006 191 191 1 202
2007 204 204 2 204 204
2008 205 205 3 206
2009 208 208 4 209
2010 211 211 5 211
2011 213 213 6 213 213
2012 230 230 7 215
SERIES TEMPORALES 191

P.7.5. Con los siguientes datos sobre la evolución de las ventas


anuales de una empresa en miles de euros, construya una nueva
serie suavizada a partir de un promedio móvil de 3 años y otra con
un promedio móvil de 7 años e indique cuál de las opciones
siguientes es verdadera.

2002 936
2003 927
2004 868
2005 830
2006 783
2007 805
2008 720
2009 750
2010 701
2011 670
2012 700

(a) Para 2006 el promedio móvil de 3 años es aproximadamente de 809,50 y


el de 7 años no puede obtenerse
(b) El promedio móvil de 7 años para 2010 no puede obtenerse
(c) El promedio móvil de 7 años para 2009 es aproximadamente de 735,90
( d) Las opciones (b) y ( c) son ciertas

Solución: La opción (b).

Justificación: Como se muestra en la tabla adjunta, donde se presentan los


resultados de las medias móvi les, la opción (a) es falsa porque para 2006 el
promedio móvil de 3 años es aproximadamente 806 y el de 7 años es
aproximadamente 811,86. La opción (c) es falsa porque el promedio móvil de
7 años para 2009 es aproximadamente 732,71. La opción (d) es falsa porque
la opción (c) es falsa.
192 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Ventas en miles 1 Media Móvil 3 Media Móvil 7


Años
de euros años años
2002 936
2003 927 910 33
2004 868 875,00
2005 830 827 00 838,43
2006 783 806,00 811,86
2007 805 769,33 779,57
2008 720 758 33 751,29
2009 750 723,67 732,71
2010 701 707 00
2011 670 690,33
2012 700

Cálculo: A continuación se describe el proceso de cálculo de las medias


móviles.

Una media móvil es un promedio de un número determinado de datos, u


orden de la media móvil, que se atribuye siempre a la fecha central si se elige
un número impar de datos; sí el número es par, lo más correcto es imputarlo
a la primera referencia de las dos fechas centrales. Por ejemplo, en nuestro
caso la media móvil de orden 3 en 2005 es:
. M' . 868+830+783
Medta ov11OruenJ ,0 ,i, =
r1

- - 3 = 827
P.7.6. Con los siguientes datos sobre la evolución de los pasajeros
anuales de un aeropuerto en miles de personas, construya tres
nuevas series suavizadas a partir de un promedio móvil de 3 años,
de un promedio móvil de 5 años y de un promedio móvil de 7 años.
Indique cuál de las opciones siguientes es verdadera.

2002 157
2003 161
2004 144
2005 150
2006 140
2007 134
2008 140
2009 150
2010 161
2011 153
2012 160
SERIES TEMPORALES 193

(a) Para 2005 el promedio móvil de 3 años es aproximadamente de 144,67 y


mayor que el de 5 años
(b) Para 2003 el promedio móvil de 3 años es aproximadamente de 154 y el
de 5 años no puede obtenerse
(c) Para 2009 el valor del promedio móvil de 5 años es mayor que el de 7
años
(d) Las opciones (b) y (c) son ciertas

Solución: La opción (b ).

Justificación: Como se muestra en la tabla adjunta, donde se presentan los


resultados de las medias móviles, la opción (a) es falsa porque para 2005 el
promedio móvil de 3 años es aproximadamente 144,67 y el de 5 años es
aproximadamente 145,80. La opción (c) es falsa porque el promedio móvil de
5 años para 2009 (147) es menor que el de 7 años (148,29). La opción (d) es
falsa porque la opción (c) es falsa.

Ventas Media Media Media


Años en miles Móvil 3 Móvil 5 Móvil 7
de euros años años años
2002 157
2003 161 154 00
2004 144 151,67 150,40
2005 150 144,67 145,80 146,57
2006 140 141,33 141,60 145 57
2007 134 138,00 142,80 145,57
2008 140 141,33 145,00 146,86
2009 150 150,33 147,60 148,29
2010 161 154,67 152,80
2011 153 158,00
2012 160

Cálculo: A continuación se descri be el proceso de cálcu lo de las medias


móviles.

Una media móvil es un promedio de un número determinado de datos, u


orden de la media móvil, que se imputa siempre a la fecha central si se elige
un número impar de datos; sí el número es par, lo más correcto es imputarlo
a la primera referencia de las dos fechas centrales. Por ejemplo, en nuestro
caso la media móvil de orden 3 en 2005 es:
194 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

. M ' ·¡ A 144 + 150 + 140


Med1a ov1 Oruen31005 = :::: 144,67
3

P.7.7. Con los siguientes datos sobre la evolución de los pasajeros


mensuales de un aeropuerto en miles de personas, calcule los
Índices de Estacionalidad para cada mes por el Método del
Porcentaje Promedio e indique cuál de las opciones siguientes es
falsa.

Meses 2010 2011 2012


Enero 11 12 12
Febrero 12 12 12
Marzo 15 15 14
Abril 14 17 16
Mayo 17 18 17
Junio 18 19 19
Julio 21 23 22
Agosto 22 23 22
Septiembre 19 20 20
Octubre 18 18 17
Noviembre 13 13 12
Diciembre 12 13 11

(a) El índice estacional de Octubre es mayor que el índice estacional de Mayo


(b) El índice estacional de Mayo es mayor que el de Abril
( c) El mayor índice estacional corresponde al mes de Agosto
(d) El menor índice estacional corresponde al mes de Febrero

Solución: La opción (d).

Justificación: Como se demuestra a continuación, y se muestra en la tabla


adjunta, la opción (d) es falsa porque el menor índice estacional corresponde
al mes de Enero.
SERIES TEMPORALES 195

Meses Índice Estacional


Enero 71,30%
Febrero 73,39%
Marzo 89,67%
Abril 95,65%
Mayo 105,94%
Junio 114,11%
Julio 134,43%
Agosto 136,51%
Septiembre 120,23%
Octubre 108,02%
Noviembre 77,44%
Diciembre 73,30%

Cálculo: A continuación se describe el proceso de cálculo de los índ ices


estacionales para cada mes mediante el método del porcentaje promedio. Se
procede de la siguiente forma:

• Se obtienen los promedios mensuales de cada año.


• Se calculan los porcentajes de las cifras mensuales en relación al
promedio mensual de cada año.
• Se elabora un índice estacional para cada mes, con el promedio de las
cantidades obtenidas en el paso anterior.

1) En la siguiente tabla se muestran los t otales y promedios mensua les de


cada año. Por ejemplo, para el año 2011 se sumaron las cantidades de
todos los meses correspondientes a ese año y se dividió el resultado por 12,
obteniendo como promedio mensual de 2011 a 16,92.

2010 2011 2012


Total 192,00 203,00 194,00
Promedios mensuales 16,00 16,92 16,17

2) Una vez obtenidos los promedios mensuales de cada año, se dividen los
viajeros de cada mes por el promedio mensual del año correspondiente,
expresándolos en forma de porcentajes, que se muestran en la siguiente
tabla. Por ejemplo, pa ra Enero de 2010 sería el cociente entre 11 y 16
expresado en tanto por ciento (68,75% ).
196 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE

3) Además en la tabla adjunta existe una columna adicional denominada


"Índice Estacional" que es la media de los tres porcentajes de cada mes,
correspondientes a los respectivos años. Por ejemplo, el Índice Estaciona l
de febrero es la media de los tres porcentajes de los viajeros de febrero en
relación al promedio de febrero de cada año . Es decir: (75,00% + 70,94%
+ 74,23%)/ 3 = 73,39% (aproxi madamente).

Como la suma de los porcentajes medios obtenidos en esta última columna,


que muestra los Índices Estacionales, es 1.200 %, lo que significa que el
promedio de los Índices Estacionales es 100 % (1.200% dividido por la
cantidad de meses en el año ), no es necesario realizar ajustes adicionales y
los Índices Estacionales obtenidos son válidos.

Porcentajes de los viajeros mensuales 1


en relación al promedio mensual de Índice
cada año Estacional
Meses 2010 2011 2012
Enero 68,75% 70,94% 74,23% 71,30%
Febrero 75,00% 70,94% 74,23% 73,39%
Marzo 93,75% 88,67% 86,60% 89,67%
Abril 87,50% 100,49% 98,97% 95,65%
Mayo 106,25% 106,40% 105,15% 105,94%
Junio 112,50% 112,32% 117,53% 114,11%
Julio 131,25% 135,96% 136,08% 134,43%
Agosto 137,50% 135,96% 136,08% 136,51%
Septiembre 118,75% 118,23% 123,71% 120,23%
Octubre 112,50% 106,40% 105,15% 108,02%
Noviembre 81,25% 76,85% 74,23% 77,44%
Diciembre 75,00% 76,85% 68,04% 73,30%

P.7.8. Con los siguientes datos sobre la evolución de los pasajeros


mensuales de un aeropuerto en miles de personas, calcule los
Índices de Estacionalidad para cada mes por el Método del
Porcentaje Promedio y proceda a la desestacionalización de la serie
citada. Indique cuál de las opciones siguientes es falsa.
SERIES TEMPORALES 197

Meses 2010 2011 2012


Enero 33 36 36
Febrero 36 36 36
Marzo 45 45 42
Abril 42 51 48
Mayo 51 54 51
Junio 54 57 57
Julio 63 69 66
Agosto 66 69 66
Septiembre 57 60 60
Octubre 54 54 51
Noviembre 39 39 36
Diciembre 36 39 33

(a) En 2012 el valor de la serie desestacionalizada en Febrero es menor que


el valor de de la serie desestacionalizada en Abril
(b)En julio de 2012 el valor de la serie desestacionalizada es
aproximadamente 49,10 miles de personas
( c) El menor valor de toda la serie desestacionalizada corresponde a Febrero
de 2011
(d) El valor de la serie desestacionalizada en Septiembre de 2011 es
aproximadamente el mismo que en Septiembre de 2012 y
aproximadamente igual a 49,90 miles de personas

Solución: La opción (c).

Justificac16n: Como se demuestra a continuación, la opción (c) es falsa porque


el menor valor de toda la serie desestacionalizada corresponde a Abril de
2010.

Serie Desestacionalizada (valores aproximados)


(Miles de personas)
Meses 2010 2011 2012
Enero 46,28 50,49 50,49
Febrero 49,05 49,05 49,05
Marzo 50, 18 50,18 46,84
Abril 43,91 53,32 50,18
Mayo 48,14 50,97 48, 14
Junio 47,32 49,95 49,95
198 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Julio 46,86 51,33 49,10


Agosto 48,35 50,54 48,35
Septiembre 47,41 49,90 49,90
Octubre 49,99 49,99 47,21
Noviembre 50,36 50,36 46,49
Diciembre 49, 12 53,21 45,02

Cálculo: A continuación se describe el proceso de cá lculo de los índices


estacionales para cada mes y de los valores de la serie desestacionalizada,
mediante el método del porcentaje promedio. Se procede de la siguiente
forma:

• Se obtienen los promedios mensuales de cada año.


• Se calculan los porcentajes de las cifras mensuales en relación al
promedio mensual de cada año.
• Se elabora un índice estacional para cada mes, con el promedio de las
cantidades obtenidas en el paso anterior.
• Dividiendo los valores de las serie original por los índices estacionales
del mes correspondiente, y multiplicando el resultado por 100,
obtenemos las magnitudes de la serie desestacionalizada de pasajeros.

1) En la siguiente tabla se muestran los totales y promedios mensuales de


cada año. Por ejemplo, para el año 2011 se sumaron las cantidades de
todos los meses correspondientes a ese año (609) y se dividió el resultado
por 12, obteniendo como promedio mensual de 2011 a 50,75 miles de
personas.

2010 2011 2012


Total 576,00 609,00 582,00
Promedios mensuales 48,00 50,75 48,50

2) Una vez obtenidos los promedios mensuales de cada año, se dividen los
viajeros de cada mes por el promedio mensual del año correspondiente,
expresándolos en forma de porcentajes, que se muestran en la siguiente
tabla. Por ejemplo, para Enero de 2010 sería el cociente entre 33 y 48,
expresado en tanto por ciento (68,75%).

3) Además en la tabla adjunta existe una columna adicional denominada


"Índice Estacional" que es la media de los tres porcentajes de cada mes,
correspondientes a los respectivos años. Por ejemplo, el Índice Estacional
de febrero es la media de los porcentajes de los viajeros de febrero en
relación al promedio de febrero de cada año. Es decir: (75,00% + 70,94%
SERIES TEMPORALES 199

+ 74,23%)/3 = 73,39% (aproximadamente).


Como la suma de los porcentajes medios obtenidos en esta última columna,
que muestra los Índices Estacionales, es 1.200 %, lo que significa que el
promedio de los Índices Estacionales es 100 % (1.200% dividido por la
cantidad de meses en el año), no es necesario realizar ajustes adicionales y
los Índices Estacionales obtenidos son válidos.

Porcentajes de laos viajeros


mensuales en relación al promedio Índice
Meses
mensual de cada año Estacional
2010 2011 2012
Enero 68,75% 70,94% 74,23% 71,30%
Febrero 75,00% 70,94% 74,23% 73,39%
Marzo 93,75% 88,67% 86,60% 89,67%
Abril 87,50% 100,49% 98,97% 95,65%
Mayo 106,25% 106,40% 105,15% 105,94%
Junio 112,50% 112,32% 117,53% 114,11%
Julio 131,25% 135,96% 136,08% 134,43%
Agosto 137,50% 135,96% 136,08% 136,51%
Septiembre 118,75% 118,23% 123,71% 120,23%
Octubre 112,50% 106,40% 105, 15% 108,02%
Noviembre 81,25% 76,85% 74,23% 77,44%
Diciembre 75,00% 76,85% 68,04% 73,30%

4) Para obtener la serie de los pasajeros ajustada estacionalmente, es decir,


descontando el efecto que provoca el ciclo estacional, se divide el valor de
cada mes por el correspondiente índice estacional y se multiplica por 100,
obteniendo los siguientes resultados. Por ejemplo, el valor
desestacionalizado correspondiente a febrero de 2010 se obtendría:
(36/73,39) x 100 = 49,05 miles de personas aproximadamente.
200 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Serie Desestacionalizada (valores aproximados)


(Miles de personas)
Meses 2010 2011 2012
Enero 46,28 50,49 50,49
Febrero 49,05 49,05 49,05
Marzo 50, 18 50,18 46,84
Abril 43,91 53,32 50,18
Mayo 48, 14 50,97 48,14
Junio 47,32 49,95 49,95
Julio 46,86 51 ,33 49,10
Agosto 48,35 50,54 48,35
Septiembre 47,41 49,90 49,90
Octubre 49,99 49,99 47,21
Noviembre 50,36 50,36 46,49
Diciembre 49, 12 53,21 45,02

P.7.9. Con los siguientes datos sobre la evolución de los pasajeros


trimestrales de un aeropuerto en miles de personas, calcule los
Índices de Estacionalidad para cada trimestre por el Método del
Porcentaje Promedio y proceda a la desestacionalización de la serie
citada. Indique cuál de las opciones siguientes es verdadera.

Trimestres 2009 2010 2011 2012


Primero (1 º) 37 38 39 38
Segundo (2º) 50 49 54 52
Tercero (3º) 59 62 66 64
Cuarto (4º) 41 43 44 40

(a) El mayor índice estacional corresponde al tercer trimestre y es


aproximadamente igual a 103,15%
(b) El menor índice estacional corresponde al primer trimestre y es
aproximadamente igual a 87,99%
(c) El menor valor de toda la serie desestacionalizada corresponde al primer
trimestre de 2011 y es aproximadamente igual a 48,48 miles de personas
(d) Ninguna de las opciones es verdadera

Solución: La opción (d).

JustificaCton: Como se demuestra a continuación, y se muestra en las tablas


adjuntas, la opción ( a) es falsa porque el mayor índice estacional corresponde
SERIES TEMPORALES 201

al tercer trimestre y es aproximadamente igual a 128,47%. La opción (b) es


falsa porque el menor índice estacional corresponde al primer trimestre y es
aproximadamente igual a 78,39% . La opción (c) es falsa porque el menor
valor de toda la serie desestacionalizada corresponde al cuarto trimestre de
2012 y es aproximadamente igual a 45,46 miles de personas.

Porcentajes de los viajeros trimestrales en


relación al promedio trimestral de cada Índice
Trimestres año Estacional
2009 2010 2011 2012
Primero (1º) 79,14% 79,17% 76,85% 78,35% 78,39%
Segundo (2º) 106,95% 102,08% 106,40% 107,22% 105,15%
Tercero ( 3º) 126,20% 129,17% 130,05% 131,96% 128,47%
Cuarto (4º) 87,70% 89,58% 86,70% 82,47% 87,99%

Serie Desestacionalizada (valores aproximados)


Trimestres (Miles de personas)
2009 2010 2011 2012
Primero (1º) 47,20 48,48 49,75 48,48
Segundo ( 2º) 47,55 46,60 51,36 49,45
Tercero (3º) 45,92 48,26 51 ,37 49,82
Cuarto (4º) 46,59 48,87 50,00 45,46

Cálculo: A continuación se describe el proceso de cálculo de los índ ices


estacionales para cada trimestre y de los valores de la serie
desestacionalizada, mediante el método del porcentaje promedio. Se procede
de la siguiente forma :

• Se obtienen los promedios trimestrales de cada año.


• Se calculan los porcentajes de las cifras trimestrales en relación al
promedio mensual de cada año.
• Se elabora un índice estacional para cada trimestre, con el promedio de
las cantidades obtenidas en el paso anterior.
• Dividiendo los valores de la serie original por los índices estacionales del
trimestre correspondiente, y multiplicando el resultado por 100,
obtenemos las magnitudes de la serie desestacionalizada de pasajeros.

1) En la siguiente tabla se muestran los totales y promedios trimestrales de


cada año. Por ejemplo, para el año 2011 se sumaron las cantidades de
todos los trimestres correspondientes a ese año (203) y se dividió el
resultado por 4, obteniendo como promedio mensual de 2011 a 50,75 miles
de personas.
202 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

2009 2010 2011 2012


Total 187,00 192,00 203,00 194,00
Promedios
46,75 48,00 50,75 48,50
trimestrales

2) Una vez obtenidos los promedios trimestrales de cada año, se dividen los
viajeros de cada trimestre por el promedio trimestral del año
correspondiente, expresándolos en forma de porcentajes, que se muestran
en la siguiente tabla. Por ejemplo, para el primer trimestre de 2010 sería el
cociente entre 38 y 48, expresado en tanto por ciento (79,17%).

3) Además en la tabla adjunta existe una columna adicional denominada


"Índice Estacional" que es la media de los cuatro porcentajes de cada
trimestre, correspondientes a los respectivos años. Por ejemplo, el Índ ice
Estacional del segundo trimestre es la media de los cuatro porcentajes de
los viajeros del segundo trimestre en relación al promedio del segundo
trimestre de cada año. Es decir: (106,95% + 102,08% + 106,40% +
107,22%)/4 = 105,15% (aproximadamente).

Como la suma de los porcentajes medios obtenidos en esta última columna,


que muestra los Índices Estacionales, es 400 %, lo que significa que el
promedio de los Índices Estacionales es 100 % ( 400% dividido por la cantidad
de trimestres en el año), no es necesario realizar ajustes adicionales y los
Índices Estacionales obtenidos son válidos.

Porcentajes de los viajeros trimestrales en


relación al promedio trimestral de cada año Índice
Trimestres
Estacional
2009 2010 2011 2012
Primero ( 1º) 79,14% 79,17% 76,85% 78,35% 78,39%
Segundo (2º) 106,95% 102,08% 106,40% 107,22% 105,15%
Tercero (3º) 126,20% 129,17% 130,05% 131,96% 128,47%
Cuarto (4º) 87,70% 89,58% 86,70% 82,47% 87,99%

4) Para obtener la serie de los pasajeros ajustada estacionalmente, es decir,


descontando el efecto que provoca el ciclo estacional, se divide el valor de
cada trimestre por el correspondiente índice estacional y se multiplica por
100, obteniendo los siguientes resultados. Por ejemplo, el valor
desestacionalizado correspondiente al segundo trimestre de 2010 se
obtendría: (49 /105,15) x 100 = 46,60 miles de personas
aproximadamente.
SERIES TEMPORALES 203

Serie Desestacionalizada (valores aproximados)


Trimestres (Miles de personas)
2009 2010 2011 2012
Primero ( 1º) 47,20 48,48 49,75 48,48
Segundo (2º) 47,55 46,60 51,36 49,45
Tercero (3º) 45,92 48,26 51,37 49,82
Cuarto (4º) 46,59 48,87 50,00 45,46

P.7.10. Con los siguientes datos sobre la evolución de los pasajeros


mensuales de un aeropuerto en miles de personas, calcule los
Índices de Estacionalidad para cada mes por el Método del
Porcentaje Promedio Móvil e indique cuál de las opciones siguientes
es verdadera.

Meses 2011 2012


Enero 1.203 1.168
Febrero 1.225 1.155
Marzo 1.519 1.414
Abril 1.729 1.604
Mayo 1.779 1.712
Junio 1.935 1.910
Julio 2.253 2.197
Agosto 2.274 2.206
Septiembre 2.024 1.953
Octubre 1.820 1.691
Noviembre 1.304 1.175
Diciembre 1.263 1.133

(a) El índice estacional de Octubre es aproximadamente igual a 105%


(b) El índice estacional de Agosto es aproximadamente igual a 124,70%
(c) El índice estacional de Abril es aproximadamente igual a 98%
(d) Ninguna de las opciones es verdadera
Solución: La opción (c).

Justificación: Como se muestra en la tabla adjunta, donde se presentan los


resultados de los índices estacionales, la opción (a) es falsa porque el índ ice
estacional de Octubre es aproximadamente igual a 108,90%. La opción (b) es
falsa porque el índice estacional de Agosto es aproximadamente igual a
134,70%. La opción (d) es falsa porque la opción (c) es verdadera.
204 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Porcentaje sobre Media Móvil (%)


Mes
(Indice estacional)
Julio 133,11%
Agosto 134,70%
Septiembre 120,41%
Octubre 108,90%
Noviembre 78,40%
Diciembre 76,11%
Enero 70,53%
Febrero 69,96%
Marzo 85,95%
Abril 98,00%
Mayo 105,29%
Junio 118,25%

Cálculo: A continuación se describe el proceso de cálculo de la vanaoon


estacional y los índices estacionales para cada mes mediante el método del
porcentaje promedio móvil. Se procede de la siguiente forma:

1) En la cuarta columna de la tabla siguiente se muestran los promedios


móviles para 12 meses de la serie de datos originales. Estos datos
aparecerían centrados en los periodos 6,5, 7,5, 8,5, etc. Por ejemplo, la
primera media móvil sería la media entre los doce meses de 2011, es decir,
1.694 y se situaría entre los meses de Junio y Julio.

2) En la quinta columna de la tabla se muestran los valores de los "promedios


móviles centrados", calculados como medias móviles de los valores
obtenidos en la columna anterior con n = 2. De esta manera, el primer
promedio aparecería centrado en el periodo 7 (Julio), ya que los datos
obtenidos en el apartado 1) se centraban en 6,5 y 7,5, respectivamente. El
segundo se centra en el mes de agosto y así sucesivamente. Por ejemplo,
el primer promedio móvil centrado sería la media de las dos primeras
medias móviles (1.694 y 1.691,08), es decir, 1.692,54, aproximadamente.
Este valor se asignaría al mes de Julio.

3) Finalmente, en la sexta columna de la tabla, se muestran los Porcentajes


sobre la Media Móvil que en este caso corresponden a los índices
estacionales, al solo existir un dato para cada mes y no necesitar obtener la
media de dichos porcentajes. Estos porcentajes se obtienen dividiendo los
datos originales por cada promedio móvil centrado de doce meses y
expresando el resultado como porcentaje (multiplicando el resultado por
SERIES TEMPORALES 205

100). Por ejemplo, el primer valor del índice estacional sería 133, l 1% que
se obtiene de multiplicar por 100 al cociente entre 2.253 y 1.692,54, es
decir: (2.253/1.692,54) x 100 y correspondería al mes de Julio.

En la tabla siguiente se muestran los resultados obtenidos aplicando los pasos


anteriores.

Promedio Móvil
Porcentaje sobre
Media Móvil Centrado
Año Mes Datos f-1edia Móvil (%)
12 meses (Serie
(Indice estacional)
desestacionalizada)
Enero 1.203
Febrero 1.225
Marzo 1.519
Abril 1.729
Mayo 1.779
Junio 1.935
1.694,00
Julio 2.253 1.692,54 133,11%
1.691,08
2011 Agosto 2.274 1.688,17 134,70%
1.685,25
Septiembre 2.024 1.680,88 120,41%
1.676,50
Octubre 1.820 1.671,29 108,90%
1.666,08
Noviembre 1.304 1.663,29 78,40%
1660,50
Diciembre 1.263 1659,46 76,11%
1.658,42
Enero 1.168 1.656,08 70,53%
1.653,75
Febrero 1.155 1.650,92 69,96%
1.648,08
2012 Marzo 1.414 1.645,13 85,95%
1.642,17
Abril 1.604 1.636,79 98,00%
1.631,42
Mayo 1.712 1.626,04 105,29%
206 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE A DE

1.620,67
Junio 1.910 1.615,25 118,25%
1.609,83
Julio 2.197
Agosto 2.206
Septiembre 1.953
Octubre 1.691
Noviembre 1.175
Diciembre 1.133

P.7.11. Con los siguientes datos sobre la evolución de los pasajeros


mensuales de un aeropuerto en miles de personas, calcule los
Índices de Estacionalidad para cada mes por el Método del
Porcentaje Promedio Móvil y proceda a la desestacionalización de la
serie citada. Indique cuál de las opciones siguientes es verdadera.

Meses 2011 2012


Enero 1.444 1.402
Febrero 1.470 1.386
Marzo 1.823 1.697
Abril 2. 075 1.925
t

Mayo 2.135 2.054
Junio 2.322 2.292
Julio 2.704 2.636
Agosto 2.729 2.647
Septiembre 2.429 2.344
Octubre 2.184 2.029
Noviembre 1.565 1.410
Diciembre 1.516 1.360

(a) El va lor de la serie desestacionalizada en el mes de Junio de 2012 no se


puede calcular
(b) El valor de la serie desestacionalizada en el mes de Agosto de 2011 es
aproximadamente igual a 2.026 Miles de personas
(c) El valor de la serie desestacionalizada en el mes de Julio de 2012 es
aproximadamente igual a 1.934,25 Miles de personas
(d) Las opciones (a) y (b) son verdaderas
SERIES TEMPORALES 207

Solución: La opción (b).

Justificación: Como se muestra en la tabla adjunta, donde se presentan los


resultados de los valores deflactados de la serie, la opción (a) es falsa porque
el valor de la serie desestacionalizada en el mes de Junio de 2012 es
aproximadamente igual a 1.938,33. La opción (c) es fa lsa porque el valor de la
serie desestacionalizada en el mes de Julio de 2012 no se puede ca lcular. La
opción (d) es falsa porque la opción (a) es falsa.

Promedio Móvil
Centrado
Datos (Serie
Año Mes
originales desestacionalizada)
(Miles de
personas)
Julio 2.704 2.031,25
Agosto 2.729 2.026,00
Septiembre 2.429 2.017,25
2011
Octubre 2.184 2.005,75
Noviembre 1.565 1.996,13
Diciembre 1.516 1.991,50
Enero 1.402 1.987,42
Febrero 1.386 1.981,17
Marzo 1.697 1.974,21
2012
Abril 1.925 1.964,21
Mayo 2.054 1.951,29
Junio 2.292 1.938,33

Cálculo: A continuación se describe el proceso de cálculo de los índices


estacionales y los valores deflactados de la serie mediante el método del
porcentaje promedio móvil. Se procede de la siguiente forma:

1) En la cuarta columna de la tabla se muestran los promedios móviles para


12 meses de la serie de datos originales. Estos datos aparecerían centrados
en los periodos 6,5, 7,5, 8,5, etc. Por ejemplo, la primera media móvil sería
la media entre los doce meses de 2011, es decir, 2.033 y se situaría entre
los meses de Junio y Julio.

2) En la quinta columna de la tabla se muestran los valores de los "promedios


móviles centrados", calculados como medias móviles de los valores
208 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

obtenidos en la columna anterior con n = 2. De esta manera, el primer


promedio aparecería centrado en el periodo 7 (Julio), ya que los datos
obtenidos en el apartado 1) se centraban en 6,5 y 7,5, respectivamente. El
segundo se centra en el mes de Agosto y así sucesivamente. Por ejemplo,
el primer promedio móvil centrado sería la media de las dos primeras
medias móviles (2.033 y 2.029,50), es decir, 2031,25, aproximadamente.
Este valor se asignaría al mes de Julio.

3) En la sexta columna de la tabla, se muestran los Porcentajes sobre la Media


Móvil, que en este caso corresponden a los índices estacionales, al solo
existir un dato para cada mes y no necesitar obtener la media de dichos
porcentajes. Estos porcentajes se obtienen dividiendo los datos originales
por cada promedio móvil centrado de doce meses y expresando el resultado
como porcentaje (multiplicando el resultado por 100). Por ejemplo, el
primer valor del índice estacional sería 133,12% que se obtiene de
multiplicar por 100 al cociente entre 2.704 y 2.031,25, es decir:
(2.704/ 2.031,25) x 100 y correspondería al mes de Julio.

4) Los resultados obtenidos en el apartado 2) para el promedio móvil centrado


constituyen la serie desestacionalizada.

En la tabla siguiente se muestran los resultados obtenidos aplicando los pasos


anteriores.

Porcentaje
Promedio Móvil
sobre
Media Centrado
Media Móvil
Año Mes Datos Móvil (Serie
,(%)
12 meses desestacionalizada)
(Indice
(Miles de personas)
estacional)
Enero 1.444
Febrero 1.470
Marzo 1.823
Abril 2.075
Mayo 2.135
2011 Junio 2.322
2.033,00
Julio 2.704 2.031,25 133,12
2.029,50
Agosto 2.729 2.026,00 134,70
2.022,50
SERIES TEMPORALES 209

Septiembre 2.429 2.017,25 120,41


2.012,00
Octubre 2.184 2.005,75 108,89
1.999,50
Noviembre 1.565 1.996,13 78,40
1.992,75
Diciembre 1.516 1.991,50 76,12
1.990,25
Enero 1.402 1.987,42 70,54
1.984,58
Febrero 1.386 1.981,17 69,96
1.977,75
Marzo 1.697 1.974,21 85,96
1.970,67
Abril 1.925 1.964,21 98,00
1.957,75
Mayo 2.054 1.951,29 105,26
2012
1.944,83
Junio 2.292 1.938,33 118,25
1.931,83
Julio 2.636
Agosto 2.647
Septiembre 2.344
Octubre 2.029
Noviembre 1.410
Diciembre 1.360
210 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
INTRODUCCIÓN A LA PROBABILIDAD 211

CAPÍTULO 8. INTRODUCCIÓN A LA PROBABILIDAD

8.1. Preguntas Teóricas

T.8.1. Indique cuál de las opciones siguientes es falsa.

(a) Un suceso es de carácter determinístico cuando al repetirlo en idénticas


condiciones no da siempre el mismo resultado
(b) Una condición de los experimentos o fenómenos aleatorios es que antes
de realizarlo, no se puede predecir el resultado que se va a obtener
(c) Una condición de los experimentos o fenómenos aleatorios es que se
puede repetir indefinidamente en las mismas condiciones
(d) Si el espacio muestra! o espacio de comportamientos tiene un número
finito, n, de elementos, el número de sucesos es 2n

Solución: La opción (a) .

Justificación: La opción (a) es falsa porque un suceso es de carácter


determinístico cuando al repetirlo en idénticas condiciones da siempre el
mismo resultado.

T.8.2. Se parte de un experimento aleatorio que consiste en el


lanzamiento de dos dados al aire y anotar la suma de las dos
puntuaciones obtenidas. Indique cuál de las opciones siguientes es
verdadera.

(a) El suceso seguro es que el resultado sea mayor o igual a 4 y menor o igual
a 12
(b) Un suceso compuesto es que el resultado de la suma de los dados sea
igual a 10.
( c) El suceso vacío imposible es cualquier valor menor que 2 y mayor que 12.
(d) Que la suma sea múltiplo de 3 no es un suceso aleatorio

Solución: La opción (c).

Justificación: La opción (a) es falsa porque el suceso seguro es el que ocurre


siempre que se realice el experimento aleatorio. Está formado por todos los
resultados posibles del experimento y, por tanto, coincide con el espacio
muestra!; al tirar los dos dados y anotar la suma, el suceso seguro es que el
resultado sea mayor o igual a 2 y menor o igual a 12.
212 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

La opción (b) es falsa porque los sucesos compuestos son los que están
formados por dos o más resultados del experimento, es decir, por dos o más
sucesos elementales. La opción (d) es falsa porque suceso aleatorio es
cualquier subconjunto del espacio muestra! E = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11,
12}; por ejemplo, que la suma sea múltiplo de 3 : = { 3, 6, 9, 12} .

T.8.3. Indique cuál de las opciones siguientes es falsa.

(a) Si A es el suceso complementario de A, se verifica que Au A = E y


An A = cD
(b) La diferencia simétrica A B de dos sucesos A y B se define como el
suceso que se verifica cuando o bien se verifica A y no se verifica B, o bien
se verifica B y no se verifica A.
(c) La diferencia simétrica A t. B de dos sucesos A y B es el suceso formado
por todos los elementos de A que no son de B.
(d) Dos sucesos A y B, se llaman incompatibles cuando no tienen ningún
elemento común

Solución: La opción (c) .

Justificación: La opción (c) es falsa porque la diferencia simétrica A t. B de


dos sucesos A y B se define como el suceso que se verifica cuando o bien se
verifica A y no se verifica B, o bien se verifica B y no se verifica A.

T.8.4. Indique cuál de las opciones siguientes es verdadera.

(a) La propiedad de simplificación para la Unión de sucesos se define como


Av0 =A
(b) De acuerdo con las Leyes de Morgan para la intersección de sucesos, el
suceso contrario de la intersección de dos sucesos es la intersección de sus
sucesos contrarios: A n B = A n B
( c) La propiedad Idempotente para la unión de sucesos se define como
A u A=A
(d) Ninguna de las opciones anteriores es verdadera

Solución: La opción (c).

Justificación: La opción (a) es falsa porque la propiedad de simplificación para


la unión de sucesos se define como A u (B n A) = A . La opción (b) es falsa
porque de acuerdo con las Leyes de Morgan para la intersección de sucesos,
el suceso contrario de la intersección de dos sucesos es la unión de sus
sucesos contrarios: A n B =Au B. La opción (d) es falsa porque la opción (c)
es verdadera .
INTRODUCCIÓN A LA PROBABILIDAD 213

T.8.5. Indique cuál de las opciones siguientes es falsa.

(a) Uno de los axiomas en que está basada la definición de Probabilidad


axiomática es que la probabilidad de todos los sucesos posibles de un
experimento es igual a 1
(b) De acuerdo con la Regla de Laplace la probabilidad de un suceso aleatorio
S es el cociente entre el número de casos favorables y el número de casos
o elementos posibles del experimento
(c) Uno de los axiomas en que está basada la definición de Probabilidad
axiomática es que si A, B, C, ... es una sucesión de sucesos mutuamente
excluyentes de S, la probabilidad asociada a la unión de todos ellos es
igual a la suma de sus probabilidades
(d) LaProbabilidad clásica o a priori se define como el límite de la frecuencia
relativa cuando el número de experimentos rea lizados tiende a infinito

Solución: La opción (d).

Justificación: La opción (d) es falsa porque La Probabilidad clásica o a priori se


define de dos formas equivalentes : 1) Si un suceso puede ocurrir de n
maneras mutuamente excluyentes e igualmente verosímiles y si de éstas
poseen un atributo A, la probabilidad de A es la fracción nA. 2) La Regla de
n
Laplace afirma que la probabilidad de un suceso aleatorio S¡ es el cociente
entre el número de casos favorables y el número de casos o elementos
posibles del experimento. P(A) = número de resultados favorables a S .
número de resultados posibles de E

T.8.6. Indique cuál de las opciones siguientes es falsa.

(a) Si el suceso A está contenido en el suceso B (Ac !J) , se cumple que P (A)=
P (B) + P (B - A)
(b) Una propiedad de la Unión de sucesos es f\A u lJ) = f\A) + P(lJ) - f\A n lJ)
(c) Para cualquier suceso A siempre se verifica que la probabilidad de que
ocurra está comprendida entre O y 1, es decir, O ~ P (A) ~ 1
(d) Si A' es el suceso complementario de A, entonces la probabilidad de A'
será igual a: P (A') = 1 - P (A)

Solución: La opción (a).

Justificación: La opción (a) es falsa porque si el suceso A está contenido en el


suceso B cA c B) , se cumple que P ( B ) = P (A)+ P (A - B)
214 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

T.8.7. Indique cuál de las opciones siguientes es verdadera .

(a) Si los sucesos son dependientes P (A11 B) = P (A) · P (B)


(b) Si los sucesos son independientes P (A11 B) = P (A)· P (B/ A) = P (B) · P
(A/B)
(c) Dados dos sucesos A y B, con P (B) > O, se define la Probabilidad
Condicionada de A (Probabilidad de A condicionada a que haya ocurrido el
suceso B), como:
P( Al 8) = P( Au 8)
P( 8)
(d) Ninguna de las opciones es verdadera

Solución: La opción (d).

Justificación: La opción (a) es falsa porque si los sucesos son dependientes P


(A 11 B) = P (A) · P (B/A) = P (B) · P (A/ B) . La opción (b) es falsa porque si los
sucesos son independientes P (A 11 B) = P (A) · P (B). La opción ( c) es falsa
porque dados dos sucesos A y B, con P (B) > O, se define la Probabilidad
Condicionada de A (Probabilidad de A condicionada a que haya ocurrido el
suceso B), como: P( AI 8) = P(~~B) .

T.8.8. En relación con la teoría de probabilidad, indique cuál de las


opciones siguientes es verdadera.
..
1

(a) La intersección de dos sucesos A y B, se define como el suceso formado


por todos los elementos de A y todos los elementos de B o lo que es lo
mismo como el suceso que se verifica cuando se realiza A o B.
(b) La diferencia simétrica de sucesos es el suceso formado por todos los
elementos de A que no son de B, es decir, el suceso que se verifica cuando
se verifica A y no se verifica B
(c) La diferencia de dos sucesos A y B, es el suceso que se verifica cuando o
bien se verifica A y no se verifica B, o bien se verifica B y no se verifica A
(d) Ninguna de las opciones es verdadera

Solución: La opción (d).

Justificación: La opción (a) es falsa porque la intersección de dos sucesos A y


B, se define como el suceso formado por todos los elementos que son, a la
vez, de A y de B (suceso que se verifica cuando se realizan simu ltáneamente
los sucesos A y B).
INTRODUCCIÓN A LA PROBABILIDAD 215

La opción (b) es falsa porque la diferencia simétrica de dos sucesos A y B, es


el suceso que se verifica cuando o bien se verifica A y no se verifica B, o bien
se verifica B y no se verifica A. La opción (c) es falsa porque la diferencia de
sucesos es el suceso formado por todos los elementos de A que no son de B,
es decir, el suceso que se verifica cuando se verifica A y no se verifica B.

T.8.9. De acuerdo con la Regla de Laplace, la probabilidad es:

(a) El cociente entre el número de casos o elementos posi bles del experimento
y el número de casos favorables
(b) El cociente entre el número de casos favorables y el número de casos
posibles o elementos posi bles del experimento
(c) La frecuencia relativa a partir de repetir 100 veces el experimento
(d) La media del número de casos favorables cuando se repite el experimento
muchas veces.

Solución: La opción (b).

Justificación: Las opciones (a), (c) y (d) son falsas porque, de acuerdo con la
Regla de Laplace, la probabilidad es el cociente entre el número de casos
favorables y el número de casos posibles o elementos posibles del
ex peri mento.

T.8.10. Los sucesos A y B son independientes si:

(a) Su unión es el conjunto vacío


(b) P (B/A) = P (A)
(c) P (A/B) = P (A)
(d) Su intersección es el conjunto A o el B

Solución: La opción (c).

Justificación: Las opciones (a), (b) y (d) son falsas porque los sucesos A y B
son independientes si P (A/B) = P (A).

T.8.11. Un experimento consiste en lanzar tres monedas, y se define


al suceso C como obtener por lo menos una cara. Entonces el valor
de P (C) es:

(a) 1/2
(b) 1/ 8
( c) 3/8
(d) 7/8
216 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Solución: La opción (d).

Justificación: Las opciones (a), (b) y (c) son falsas porque el suceso C,
consistente en obtener por lo menos una cara, solamente no se cumple
cuando el resultado consista en que salgan tres cruces, es decir se cumple
para los 7 casos restantes. Por lo tanto, aplicando la Regla de Laplace, al ser
el número de casos posibles 23 = 8, el valor de P (C) es 7/8. También se
puede obtener esta probabilidad, basándose en que la probabilidad del suceso
complementario del C, consistente en que salgan tres cruces, es 1/8, luego P
(C) = 1- (1/8) = 7/8.

T.8. 12. Suponiendo que un año tiene 365 días, la probabilidad de que
los cumpleaños de tres hermanos sean en el mes de junio (que tiene
30 días) es aproximadamente:

(a) 30/365
(b) 1/12
(C) 5,55 X 10-4
(d) Ninguna de las anteriores opciones es verdadera

Solución: La opción (c).

Justificación: Las opciones (a) y (b) son falsas porque la probabilidad de que
los cumpleaños de tres hermanos sean en el mes de junio (que tiene 30 días)
es (30* 30* 30) / (365 * 365* 365) que es aproximadamente igual a 5,55 x 10·4 .
Este valor se obtiene aplicando la regla de Laplace, y que al tratarse de
sucesos independientes, la probabilidad de su intersección es el producto de la
correspondientes probabilidades (P (A n Bn c) = P (A) · P (B) · P (C)). La
opción ( d) es falsa porque la opción ( c) es verdadera

T.8.13. Indique para cuál de las siguientes opciones se cumple la


igualdad An B =rjJ .

(a) Nunca se cumple


(b) Si los sucesos son compatibles
(c) Si los sucesos son incompatibles
(d) Siempre se cumple

Solución: La opción (c).

Justificación: Las opciones (a), (b) y (d) son falsas porque por la propia
definición de sucesos incompatibles: dos sucesos A y B, se llaman
incompatibles cuando no tienen ningún elemento común . Es decir, la igualdad
( An fl = </> ) se cumple si los sucesos son incompatibles.
INTRODUCCIÓN A LA PROBABILIDAD 217

T.8.14. En teoría de la probabilidad lCuál de las siguientes


afirmaciones es falsa?

(a) La Unión de los sucesos A y B (A v B) es el suceso formado por todos los


elementos de A y todos los elementos de B (suceso que se verifica cuando
se realiza A ó B)
(b) El suceso complementario de A, se verifica cuando no se verifica A
(c) La diferencia simétrica de dos sucesos A y B, es el suceso formado por
todos los elementos de A que no son de B (suceso que se verifica cuando
se verifica A y no se verifica B)
(d) Dos sucesos A y B, se llaman incompatibles cuando no tienen ningún
elemento común

Solución: La opción (c).

Justificación: La opción (c) es fa lsa porque la diferencia simétrica de dos


sucesos A y B, es el suceso que se verifica cuando o bien se verifica A y no se
verifica B, o bien se verifica B y no se verifica A.

T.8.15. Si A es un suceso seguro:

(a) La probabilidad de A es superior a O e inferior a 1


(b) La probabilidad de A es cero
( c) Lo único que podemos afirmar es que la probabilidad de A es menor que 1
(d) Ninguna de las opciones es cierta

Solución: La opción (d).

Justificación: Las opciones (a), (b) y (c) son falsas porque se define como
suceso seguro aquel que ocurre siempre que se realice el experimento
aleatorio, por tanto su probabilidad es l.

T.8.16. Indique cuál de las siguientes opciones es falsa.

(a) Las Leyes de Margan en la Unión de sucesos consisten en que el suceso


contrario de la unión de dos sucesos es la intersección de sus sucesos
contrarios: Av B= An 8
(b) La Diferencia simétrica A ó. B de dos sucesos A y B, es el suceso que se
verifica cuando o bien se verifica A y no se verifica B, o bien se verifica B y
no se verifica A
(c) Si los sucesos son dependientes P (A n B) = P (A)· P (B)
( d) Las opciones (a) y (b) son verdaderas

Solución: La opción (c).


218 EJERCIC IOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Justificación: La opción (c) es falsa porque si los sucesos son depend ientes, P
(A n B) = P (A) · P (B/A) = P (B) · P (A/B).

T.8.17. Indique la respuesta falsa.

(a) Una de las condiciones que se verifican en los Experimentos o fenómenos


aleatorios consiste en que antes de rea lizarlo, no se puede predecir el
resultado que se va a obtener
(b) Una de las propiedades de los sucesos, conocida como Leyes de Margan,
consiste en que el suceso contrario de la intersección de dos sucesos es la
unión de sus sucesos contrarios: An B = Au 8
(c) La Regla de Bayes consiste en que la probabil idad de un suceso aleatorio
es el cociente entre el número de casos favorables y el número de casos o
elementos posibles del experimento
(d) Las opciones (a) y (b) son verdaderas

Solución: La opción (c).

Justificación: La opción (c) es falsa porque la Regla de Bayes para el cálculo


de la probabilidad condicional consiste en que:

¡-1

La opción que se muestra en (c) corresponde a la Regla de Laplace.

T.8.18. En relación con las propiedades de los sucesos, indique la


opción verdadera.

(a) La propiedad asociativa se define como An ( Bn C}= (An B)n e (para la


intersección) y como Au (Bu C) = (Au B)u C (para la unión).
(b) La propiedad indempotente se define como A n A = ~ (para la intersección)
y como Av A = A (para la unión).
(c) Las opciones (a) y (b) son falsas
(d) Las opciones (a) y (b) son verdaderas

Solución: La opción (a) .

Justificación: La opción (b) es fa lsa porque la propiedad indempotente se


defi ne como An A = A (para la intersección) y como Av A= A (para la unión).
La opción (c) es falsa porque la opción (a) es verdadera. La opción (d) es falsa
porque la opción (b) es falsa.
INTRODUCCIÓN A LA PROBABILIDAD 219

T.8.19. En el ámbito de la teoría de la probabilidad, indique cuál es la


opción correcta.

(a) La Regla de Laplace define la probabilidad de un suceso aleatorio S¡ como


el cociente entre el número de casos favorables y el número de casos o
elementos posibles del experimento
(b) La Ley de Bernouilli, también denominada ley de los grandes números
define la probabilidad como el límite de la frecuencia relativa cuando el
número de experimentos realizados tiende a infinito
(c) El Teorema de Bayes se aplica a los sucesos equiprobables y es una
consecuencia directa de la aplicación de la Regla de Laplace
(d) Las opciones (a) y (c) son verdaderas

Solución: La opción (a).

Justificación: La opción (b) es falsa porque la Ley de Bernouilli, ta mbién


denominada ley de los grandes números, afirma que un experimento aleatorio
se caracteriza porque repetido muchas veces y en idénticas condiciones, el
cociente entre el número de casos favorables y el número de casos o
elementos posibles del experimento tiende a un número fijo. La opción (c) es
falsa porque el teorema de Bayes no se aplica a los sucesos equiprobables y
no es una consecuencia directa de la aplicación de la Regla de Laplace. La
opción (d) es falsa porque la opción (c) es falsa.

T.8.20. El suceso que ocurre siempre que no ocurre el suceso A se


dice que es:

(a) Suceso seguro


(b) Suceso complementario o suceso contrario
(c) Suceso incompatible
(d) Ninguna de las anteriores

Solución: La opción (b ).

Justificación: Las opciones (a) y (c) son falsas porque la definición de suceso
complementario o suceso contrario del suceso A es como el suceso que se
verifica cuando no se verifica A. La opción (d) es falsa porque la opción (b) es
verdadera.
220 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍ STICA DE A DE

T.8.21. lCuándo se cumple la desigualdad P {AUB) < P (A) + P (B)?

(a) Si los sucesos son incompatibles


(b) Si los sucesos son compatibles
( c) Nunca se cumple
(d) Siempre se cumple

Solución: La opción (b ).

Justificación: Las opciones (a), (c) y (d) son falsas porque por la propiedad de
la Unión, M: Av b') = fiA) + M'.fi) - f-'\:A n B); pero si los sucesos A y B, son
incompatibles no tienen ningún elemento común, es decir, An !J = </J .

T.8.22. En la puerta de una Facultad hay tres fotocopiadoras, A, B y


e, que tienen unas probabilidades de fallar, respectivamente, de
0,02, 0,03 y 0,04. Un alumno entra en la Facultad y, al estar libres las
tres fotocopiadoras, elige una al azar. Al llegar a clase observa que la
fotocopia es defectuosa. lQué aplicaría para saber cuál es la
probabilidad de obtener una fotocopia defectuosa?

(a) Teorema de Bayes


(b) Regla de La place
(c) Teorema de la probabilidad total
(d) Las opciones (b) y (c) son correctas

Solución: La opción ( c).

Justificación: Las opciones (a) y (b) son falsas porque por el teorema de la
1-_;

probabilidad total f\B)= ¿P( Bn A, ) , siendo P( Bn A


1
) la probabilidad de
/=l

obtener una fotocopia defectuosa de la fotocopiadora i. La opción (d) es falsa


porque la opción (b) es falsa.
INTRODUCCIÓN A LA PROBABILIDAD 221

8.2. Problemas

P.8.1. En una clase hay 16 niños y 24 niñas, de los cuales la mitad de


los niños y la mitad de las niñas tienen el pelo negro, lCuál es la
probabilidad de que elegido un alumno al azar sea niño o tenga el
pelo negro?

(a) 16/40
(b) 36/40
(c) 28/40
(d) 10/40

Solución: La opción (c) .

Justificación: Las opciones (a), (b) y (d) son falsas porque, como se
demuestra a continuación, la probabilidad de que elegido un alumno al azar,
sea niño o tenga el pelo negro es 28/40.

Cálculo: Los sucesos que forman parte de la probabilidad a calcular son los
siguientes:
A: Ser niño
B: Tener el pelo negro

Se aplica la regla de Laplace para calcular las probabilidades de los sucesos


elementales A y B. Por ejemplo:

P( A) = número de resultados favorables a A = ~


número de resu ltados posibles 40

20
Asimismo: P(B)=
40

La probabilidad que deseamos calcular es P( Au 8) . Para calcularla, usamos la


propiedad de la Unión: P(A u 8) = P(A) + P(B) - P(A n 8)

En nuestro caso como la probabilidad de que sea niño y tenga el pelo negro es
8/ 40;

16 20 8 28
P(A u 8) = -+ - - -~ P( Au B) = -
40 40 40 40
222 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

P.8.2. Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2


bolas rojas y 1 negra y C con 2 bolas rojas y 3 negras. Escogemos
una urna al azar y extraemos una bola. Si la bola ha sido roja, lCuál
es la probabilidad de haber sido extraída de la urna A?

(a) Aproximadamente 0,26


(b) Aproximadamente 0,43
(c) Aproximadamente 0,18
(d) Aproximadamente 0,6

Solución: La opción (a).

Justificación: Las opciones (b), (c) y (d) son falsas porque, como se demuestra
a continuación, la probabilidad de que la bola roja haya sido extraída de la
urna A es aproximadamente 0,26.

Cálculo: Si denominamos A, B y C a los sucesos elegir las urnas A, B y e, y


denotamos por R, y N a los sucesos extraer una bola roja y negra,
respectivamente, obtenemos los resultados siguientes:
P(A)=_!_
3
P(RI A)=~
8
!{_R! A)= f{_Rn A)=> f{_Rn A)= !{_A)!{_RI A)=_!_ · ~ = -2_
A_ ~ 3 8 ~
Análogamente:
1 2 2
!{_Rn B)= f{_B)!{_R! B) =- ·-=-
3 3 9
1 2 2
!{_ Rn C)= f{_c)!{_R! C)=- ·-=-
3 5 15

A partir de las probabilidades anteriores, aplicamos el Teorema de Bayes para


obtener la probabilidad pedida .

f\R! A)= f\R n A)= f\R n A)


f\A ) f\A n R)+ f\Bn R)+ f\C n R)
3
f\A )f\R I A) 24 - 0 26
f\A)f\R I A)+ f\B)f\R I B)+ f\C)f\R! C) 3 +2 + 2 - .
24 9 15
INTRODUCCIÓN A LA PROBABILIDAD 223

P.8.3. Suponiendo que en una Universidad el 60º/o de alumnos son


mujeres y el 40º/o son hombres y que el 25º/o de las mujeres y el
35°/o de los hombres utilizan el coche para desplazarse, indique cuál
de las afirmaciones siguientes es falsa.

(a) La probabilidad de que una estudiante sea mujer y no utilice el coche es


0,45
(b) La probabilidad de que un estudiante sea hombre y no utilice el coche es
0,26
(c) La proba bilidad de que un estudiante sea hombre y utilice el coche es 0,25
(d) La probabilidad de que un estudiante utilice el coche es 0,29

Solución: La opción (c).

JustificaC16n: La opción (c) es falsa porque la probabilidad de que un


estudiante sea hombre y utilice el coche es 0,14, como se demuestra a
continuación .

Cálculo: Si denominamos H y M, a los sucesos ser un estudiante hombre y


mujer, respectivamente y denotamos por C, y N a los sucesos
correspondientes a que utilice el coche y que no utilice el coche,
respectivamente, disponemos de los resultados siguientes:

P (M) = 0,6
P (H) = 0,4
P (C/M) = 0,25
P (C/ H) = 0,35
A partir de los resultados anteriores y apl icando la probabilidad del suceso
complementario, de la intersección o probabilidad compuesta y en su caso el
Teorema de la probabilidad tota l, las probabilidades que se solicitan en cada
una de las cuatro cuestiones son las sigu ientes:

(a) P( M n N) = P( N I M )P(M) = (1- 0,25) x 0,6 = 0,75 x 0,6 = 0,45

(b) P( H n N) = P( N / H)P( H) = (1- 0,35) x 0,4 = 0.65 x 0,4 = 0,26

( c) R.. H n l ) = Pf. l'I H ) 11 H ) = 0,35 x 0,4 = 0,14

Aná loga mente: P( M n l') = P( l' 1 M) P( M) = 0,25 x 0,6 = 0. 15

(d) Por el Teorema de la probabilidad total :


224 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

f{ C) = f{H)f{C I H) + f{M )f{ CI M) = 0.4 x 0.35 + 0.6 x 0.25 = 0.29

Esta última probabilidad también se puede ca lcular de la siguiente manera:

f{C) = fl... H n C) + fl... M n C) = 0.1 4 + 0,15 = 0,29


P.8.4. Una urna contiene 3 bolas blancas y 2 bolas rojas y otra urna
contiene 3 bolas blancas y 4 bolas rojas. Se extrae una bola de cada
urna. Indique cuál de las contestaciones siguientes es verdadera.

(a) La probabilidad de que las dos bolas sean rojas es 4/35


(b) La probabilidad de que las dos bolas sean blancas es 8/ 35
(c) La probabilidad de que una sola de las dos bolas sea blanca es 23/ 35
(d) Ninguna de las otras contestaciones es verdadera

Solución: La opción (d).

Justificación: La opción (a) es fa lsa porque la probabilidad de que las dos


bolas sean roj as es 2/ 5 x 4/7 = 8/35. La opción (b) es fa lsa porque la
probabilidad de que las dos bolas sean blancas es 3/5 x 3/7 = 9/35. La opción
( c) es falsa porque la probabilidad de que una sola de las dos bolas sea
blanca es 1 - (9/ 35) - (8/35) = 18/ 35. A continuación se detallan los cálculos
realizados para llegar a los resultados citados .

Cálculo: Al extraer una bola de cada urna, se trata de dos sucesos


independientes por lo que P (A n B) = P (A)·P (B) . Esto nos permit e calcular
las probabilidades solicitadas:

(a) La probabilidad de que las dos bolas sean rojas es 2/5 x 4/ 7 = 8/ 35.
(b) La probabilidad de que las dos bolas sean blancas es 3/5 x 3/7 = 9/ 35.
( c) La probabil idad de que una sola de las dos bolas sea blanca, es 1 - (9/35)
- (8/35) = 18/35 ya que ya que se trata del suceso complementario de los
sucesos consistentes en que salgan dos bolas blancas (cuya probabilidad
es 9/ 35) o dos bolas rojas (cuya probabilidad es 8/ 35) .

Otra forma de obtenerlo es como la suma de las probabi lidades de los


sucesos consistentes en extraer una bola blanca de la primera urna y una
roja de la segunda urna; y una bola roja de la primera urna y una blanca
de la segunda urna, respectivamente, es decir, 12/35 + 6/ 35 = 18/ 35.
INTRODUCCIÓN A LA PROBABILIDAD 225

P.8.5. Una urna contiene 2 bolas blancas, 3 bolas rojas y 2 bolas


negras. Se extraen 3 bolas. Indique cuál de las contestaciones
siguientes es verdadera.

(a) Si cada bola se reemplaza después de su extracción, la probabilidad de


que se extraigan en el orden: blanca, roja y negra, es 6/343
(b) Si cada bola no se reemplaza después de su extracción, la probabilidad de
que se extraigan en el orden: blanca, roja y negra, es 12/ 343
(c) Si cada bola no se reemplaza después de su extracción, la probabilidad de
que se extraigan en el orden : blanca, negra y negra, es 8/343
(d) Si cada bola se reemplaza después de su extracción, la probabilidad de
que se extraigan en el orden: blanca, negra y negra, es 8/343

Solución: La opción (d).

Justificación: La opción (a) es falsa porque si cada bola se reemplaza después


de su extracción, la probabilidad de que se extraigan en el orden: blanca, roja
y negra, es: 12/343. La opción (b) es falsa porque si cada bola no se
reemplaza después de su extracción, la probabilidad de que se extraigan en el
orden: blanca, roja y negra, es 12/2 10. La opción (c) es falsa porque si cada
bola no se reemplaza después de su extracción, la probabilidad de que se
extraigan en el orden: blanca, negra y negra, es 4/2 10. La opción (d) es
verdadera porque si cada bola se reem plaza después de su extracción, la
probabilidad de que se extraigan en el orden : blanca , negra y negra, es: (2/7)
X (2/7) X (2/7) = 8/343.

Cálculo: Para resolver este problema hay que tener en cuenta que si cada bola
se reemplaza después de su extracción se trata de sucesos independientes y
en este caso P (A n B) = P (A) · P (B). Por el contrario, si cada bola no se
reemplaza después de su extracción se trata de sucesos dependientes y en
este caso P (A n B) = P (A) · P (B/A). De acuerdo con ello, las probabil idades
que se solicitan son las siguientes :

(a) Si cada bola se reemplaza después de su extracción, la probabilidad de


que se extraigan en el orden: blanca, roja y negra, es: (2/7) x (3/7) x
(2/7) = 12/343.

(b) Si cada bola no se reemplaza después de su extracción, la probabilidad de


que se extraigan en el orden: blanca, roja y negra, es : (2/ 7) x (3/6) x
(2/5) = 12/210.

(c) Si cada bola no se reemplaza después de su extracción, la probabilidad de


que se extraigan en el orden : blanca, negra y negra, es : (2/7) x (2/6) x
(1/ 5) = 4/ 210.
226 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE A DE

( d) Si cada bola se reemplaza después de su extracción, la probabilidad de


que se extraigan en el orden: blanca, negra y negra, es: (2/ 7) x ( 2/ 7) x
(2/ 7) = 8/343.

P.8.6. En una pregunta de test con cuatro alternativas y con solo una
de ellas válida, un alumno conoce la respuesta con probabilidad 0,70.
En el caso de que sepa la respuesta, contesta acertadamente con una
probabilidad de 0,90, mientras que si no lo sabe, contesta
aleatoriamente, es decir, al azar. Indique la respuesta verdadera.

(a) La probabilidad de contestar correctamente es aproximadamente 0,456


(b) La probabilidad de que un alumno que ha contestado acertadamente, sepa
realmente la respuesta, es aproximadamente 0,627
(c) La probabilidad de no conocer la respuesta es 0,4
( d) Ninguna de las respuestas es verdadera

Solución: La opción (d).

Justificación: La opción (a) es falsa porque la probabilidad de contestar


correctamente, es O, 78. La opción (b) es falsa porque la probabilidad de que
un alumno que ha contestado acertadamente, sepa realmente la respuesta es
0,81. Finalmente, la opción (c) es falsa porque la probabilidad de no conocer
la respuesta es 0,3. A continuación se desarrollan los cálculos realizados para
obtener las soluciones correctas.

Cálculo: Denominamos C y N a los sucesos conocer y no conocer la respuesta,


y denotamos por A, y F a los sucesos contestar acertadamente y falla r,
respectivamente.

Conocemos las probabilidades siguientes:

p (C) = 0,70
P (N) = 0,30
P (A/C) = 0,90
P {A/N) = 0, 50

(a) Para calcular la probabilidad de contestar correctamente, P {A), aplicamos


el teorema de la probabilidad total :

Ft A) = M: Al C:) Ft f..,)+ Ft Al N) Ft N)

Sustituyendo los valores correspondientes :

Ft A)= Ft Al f..,)M: f..,) + F\A I N)f\ N) = 0,90 X 0,70+ 0,50 X 0,30 = 0.78
INTRODUCCIÓN A LA PROBABILIDAD 227

(b) Para calcular la probabilidad de que un alumno que ha contestado


acertadamente, sepa realmente la respuesta, se aplica el Teorema de
Bayes. La probabilidad que se pide es la siguiente:
f{ CI A)= f{A n C) = f{C )x !{Al C) = 0.7x0.9 = 0.63 ~ 0_8 1
f{ A) f{ A) 0,78 0,78

(c) Para calcular la probabilidad de no conocer la respuesta P (N), basta con


considerar que dicho suceso es el complementario del suceso, conocer la
respuesta C. Por tanto:

ft N ) = 1- M: {,,) = 1- O. 7 =0,3

P.8.7. En un grupo de 20 personas hay 8 mujeres y 12 varones; 15


fumadores y 6 personas que estudian carreras universitarias. Se
elige una persona del grupo al azar, indique cuál de las siguientes
afirmaciones es verdadera.

(a) La probabilidad de que sea mujer es de 2/5 y de que sea fumador y mujer
de 3/4
(b) La probabilidad de que no sea mujer es de 3/5 y de que no sea fumador
de 3/4
(c) La probabilidad de que sea fumador y universitario es de 7/ 10
(d) Todas las opciones son falsas

Solución: La opción (d).

Justificación: La opción (a) es falsa porque la probabilidad de que sea mujer


es de 8/20 = 2/5 y de que sea fumador y mujer, es: 15/20 x 8/20 = 120/ 400
= 3/10. La opción (b) es falsa porque la probabilidad de que no sea mujer es
de 12/20 = 3/5 y de que no sea fumador de 5/20 = 1/4. La opción (c) es falsa
porque la probabilidad de que sea fumador y universitario es de 15/20 x 6/20
= 3/4 x 3/10 = 9/40. A continuación se desarrollan los cálculos realizados para
obtener las soluciones correctas.

Cálculo: Se denomina como M, V, F y U a los sucesos, ser mujer, ser varón,


ser fumador y estudiar carrera universitaria, respectivamente.

Conocemos las probabilidades siguientes:

P (M) = 8/20
P (V) = 12/20
P (F) = 15/20
P (U) = 6/20
228 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Las probabilidades que se solicitan son las siguientes :


(a) La probabilidad de que sea mujer, es: P(M) =-= 0.4
20
La probabilidad de que sea fumador y mujer, es:
120
P(F n M) = P(F)F\M) =.!2. ·_!_= =0,3 (Al ser sucesos independientes)
20 20 400

(b) La probabilidad de que no sea mujer, es:


P(H) = l -_!_= 0.6
20
La probabilidad de que no sea fumador es:
15 -
1- P( F)= 1- - = ~ = 0,25
20 20

(c) La probabilidad de que sea fumador y universitario es:


90
P( Fn U)= P( F)F\ U)=.!2.. _i_ = = -2._ = 0,225 (Al ser sucesos independientes)
20 20 400 40

P.8.8. Se sabe que entre los estudiantes de Ciencias Económicas de


la UNED el 46º/o son hombres y el 60º/o de los hombres tienen coche,
mientras que entre las mujeres solo tienen coche el 40°/o. Si
escogemos un estudiante al azar, lCuál es la opción verdadera?

(a) La probabilidad de que el estudiante no tenga coche es aproximadamente


0,454
(b) La probabilidad de que el estudiante sea varón y no tenga coche es
aproximadamente 0,6
(c) La probabilidad de que el estudiante tenga coche es aproximadamente
0,492
(d) Ninguna de las anteriores es verdadera

Solución: La opción (c).

Justificación: La opción (a) es falsa porque la probabilidad de que el


estudiante no tenga coche es aproximadamente 0,508. La opción (b) es falsa
porque la probabilidad de que el estudiante sea varón y no tenga coche es
0,4. La opción (d) es falsa porque la opción (c) es verdadera. A continuación
se desarrollan los cálculos realizados para obtener las soluciones correctas.

Cálculo: Denominamos C al suceso " tener coche", N al suceso " no tener


coche", H al suceso "ser hombre" y M al suceso "ser mujer".

Conocemos las probabilidades siguientes:


INTRODUCCIÓN A LA PROBABILIDAD 229

P (H) = 0,46
P (M) = 1- P (H) = 0,54
P (C/H) = 0,60
P (C/M) = 0,40
P (N/H) = 1- P (C/H) = 0,40
P (N/M) = 1- P (C/ M) = 0,60

(a) Para calcular la probabilidad de que el estudiante no tenga coche P (N),


aplicamos el teorema de la probabilidad total:

P( N )= P( N / H )P( H )+ P( N / M )P(M)
Sustituyendo los valores correspondientes :

P( N ) = P( N / H) P( H) + P( N / M) P( M ) = 0,40 x 0.46+ 0.60 x 0,54 = 0,508

(b) La probabilidad de que el estudiante sea varón y no tenga coche es P


(N/H) = 1- P (C/H) = 0,40

(c) Para calcular la probabilidad de que el estudiante tenga coche, basta con
considerar que dicho suceso es el complementario del suceso, el
estudiante no tenga coche. Por tanto:

P( {.,) = 1- P( N ) = 1- 0,508 = 0,492

También se podía haber resuelto aplicando el teorema de la probabilidad total:

P( l ) = P( {.,' / H) P( H) + P( {.,' / M ) P( M )

Sustituyendo los valores correspondientes:

R.. l) = !-'( {.,' / H ) P( H ) + P( {.,' / M) P( M ) =0,60 X 0.46 + 0.40 X 0.54 =0,492

P.8.9. Se tiene una caja que contiene 6 bolas rojas, 4 bolas blancas y
5 bolas azules. Indique la respuesta falsa.

(a) Si una bola se extrae aleatoriamente de la caja, la probabilidad de que la


bola no sea roja es 0,6
(b) Si se extraen tres bolas sucesivamente de la caja "con" reemplazamiento,
la probabilidad de que se extraigan en el orden roja, blanca, azul, es
aproximadamente 0,036
( c) Si se extraen tres bolas sucesivamente de la caja " sin" reemplazamiento, la
probabilidad de se extraigan en el orden roja, blanca, azul es
aproximadamente 0,124
(d) Las respuestas (a) y (b) son verdaderas
230 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

Solución: La opción (c).

Justificación: La opción (c) es falsa porque si se extraen tres bolas


sucesivamente de la caja "sin" reemplazamiento, la probabilidad de se
extraigan en el orden roja, blanca, azul es aproximadamente 0,044. A
continuación se desarrollan los cálculos realizados para obtener las soluciones
correctas.

Cálculo: Para resolver este problema hay que tener en cuenta que si cada bola
se reemplaza después de su extracción se trata de sucesos independientes y
en este caso P (A n B) = P (A) · P (B). Por el contrario, si cada bola no se
reemplaza después de su extracción se t rata de sucesos dependientes y en
este caso P (A n B) = P (A) · P (B/A). De acuerdo con ello, las probabilidades
que se solicitan son las siguientes:

(a) Si una bola se extrae aleatoriamente de la caja, la probabilidad de que la


bola no sea roja es 0,6. Esta probabilidad se obtiene teniendo en cuenta
que el suceso complementario es "extraer una bola roja", cuya
probabilidad es 0,4. Por tanto la probabilidad de que la bola no sea roja
es: 1 - 0,4 = 0,6 .

(b) Si se extraen tres bolas sucesivamente de la caja "con" reemplazamiento,


la probabilidad de se extraigan en el orden: roja, blanca, azul es: 6/15 x
4/15 x 5/15 = 120/3375 = 0,036 (aproximadamente) .

(c) Si se extraen tres bolas sucesivamente de la caja "sin" reemplazamiento, la


probabilidad de se extraigan en el orden roja, blanca, azul es: 6/15 x 4/14
x 5/13 = 120/2730 = 0,044 (aproximadamente).

P.8.10. En la tabla siguiente se muestran las preferencias de los


turistas de diferentes edades sobre 3 destinos: A, B y C. Indique la
opción verdadera.

Edad de los Destino


encuestados A B e
Entre 18 y 35 años 60 90 50
Entre 35 y 60 años 80 100 40
Más de 60 años 70 80 30
INTRODUCCIÓN A LA PROBABILIDAD 231

(a) La probabilidad de que el turista prefiera el destino B es 0,35


(b) La probabilidad de que el turista tenga menos de 60 años es 0,70
(c) La probabilidad de que el turista tenga entre 18 y 60 años o prefiera el
destino e es 0,85
( d) Las opciones (b) y (c) son verdaderas

Solución: La opción (b).

Justificación: La opción (a) es falsa porque la probabilidad de que el turista


prefiera el destino B es 0,45. La opción (c) es falsa porque la probabilidad de
que el turista tenga entre 18 y 60 años o prefiera el destino C es
aproximadamente 0,75. La opción (d) es falsa porque la respuesta (c) es falsa.
A continuación se desarrollan los cálculos realizados para obtener las
soluciones correctas.

Cálculo: Para facilitar los cálculos en la tabla adjunta se muestran todas las
sumas totales de filas y columnas.

Edad de los Destino


encuestados A B e TOTAL
Entre 18 y 35 años 60 90 50 200
Entre 35 y 60 años 80 100 40 220
Más de 60 años 70 80 30 180
TOTAL 210 270 120 600

Para obtener las probabilidades solicitadas, emplearemos la regla de Laplace


que consiste en que la probabilidad de un suceso aleatorio es el cociente entre
el número de casos favorables y el número de casos o elementos posibles del
experi mento. También se emplea la siguiente propiedad de la Unión de
sucesos:

P(A u B) = P(A)+ P(B)-P(A n B) . De acuerdo con ello, las probabilidades que


se solicitan son las siguientes:

(a) La probabilidad de que el turista prefiera el destino Bes 270/600 = 0,45


(b) La probabilidad de que el turista tenga menos de 60 años es 420/ 600 =
0,70.

( c) La probabi lidad de que el turista tenga entre 18 y 60 años o prefiera el


destino C es 0,617 aproximadamente. Para ca lcular dicha probabilidad se
aplica la propiedad de la Unión de sucesos:
232 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE

P( Au 8) = P( A) + P( 8)- P( A n 8) .

Es decir, P (tenga entre 18 y 60 años o prefiera el destino C) = P (tenga


entre 18 y 60 años) + P (prefiera el destino C) - P (tenga entre 18 y 60
años y prefiera el destino C) = 420/ 600 + 120/600 - 90/ 600 = 450/ 600 =
0,75

P.8.11. Al instalar unos nuevos sistemas de ordenadores, se ha


observado que el 18º/o de los equipos recién fabricados presentan
exactamente un defecto, el 8º/o tiene exactamente dos defectos, el
4°/o tiene exactamente tres defectos y el 1 º/o tiene exactamente
cuatro o más defectos. Indique cuál es la opción falsa.

( a) La probabilidad de que no tenga defectos es 0,71


(b) la probabilidad de que tenga dos o más defectos es 0,13
(c) La probabilidad de que tenga tres o más defectos es 0,05
( d) Las opciones (b) y ( c) son verdaderas

Solución: La opción (a).

Justificación: La opción (a) es falsa porque la probabilidad de que no tenga


defectos es 0,69 . A continuación se desarrollan los cálculos realizados para
obtener las soluciones correctas.

Cálculo: Para obtener las probabilidades solicitadas, emplearemos la siguiente


propiedad de la Unión de sucesos: P( A u lf) = fi. A)+fi.8) - P( A n lf). De
acuerdo con ello, las probabilidades que se solicitan son las siguientes:

(a) La probabilidad de que no tenga defectos es 0,69. El suceso "O defectos",


tiene por complementario el suceso " 1 o más defectos". Para calcular esta
última probabilidad, se aplica la propiedad de la Unión de sucesos:
P( A u B) = P( A) + P( lf) - P( A n lf) . Es decir, teniendo en cuenta que son
sucesos disjuntos y por tanto la probabilidad de la intersección es nula, P
(tenga uno o más defectos) = P (tenga un defecto u tenga dos defectos
u tenga tres defectos u tenga cuatro o más defectos) =
P (tenga un
defecto) + P (tenga dos defectos) + P (tenga t res defectos) + P (tenga
cuatro o más defectos) = 0,18 + 0,08 + 0,04 + 0,01 =0,31. Por lo tanto,

ft'O defectos) =1- ft' 1o más defectos)= 1- (O, 18 + 0,08 + 0.04 + 0,01 ) =0.69
INTRODUCCIÓN A LA PROBABILIDAD 233

(b) La probabilidad de que tenga dos o más defectos es 0,13. Pa ra calcular


dicha probabilidad se aplica la propiedad de la Unión de sucesos:
ftA u B) = f-tA) + f-tff)- f1'.A n B) . Es decir, teniendo en cuenta que son
sucesos disjuntos y por tanto la probabilidad de la intersección es nula, P
(tenga dos o más defectos) = P (tenga dos defectos v tenga tres defectos
v tenga cuatro o más defectos) = P (tenga dos defectos) + P (tenga tres
defectos) + P (tenga cuatro o más defectos) = 0,08 + 0,04 +0,01 = 0,13.

(c) La probabilidad de que tenga tres o más defectos es 0,05. Para calcular
dicha probabilidad se aplica la propiedad de la Unión de sucesos:
rt Av B) = f1'. A) + P(, 8)- f1'. An B). Es decir, teniendo en cuenta que son
sucesos disjuntos y por tanto la probabilidad de la intersección es nula, P
(tenga tres o más defectos) = P (tenga tres defectos v tenga cuatro o
más defectos) = P (tenga tres defectos) + P (tenga cuatro o más
defectos) = 0,04 + 0,01 = 0,05.

P.8.12. Se tienen dos urnas, donde la primera contiene 3 bolas


negras, 3 azules y 4 verdes y la segunda 2 negras 1 azul y 3 verdes.
Se tira una moneda y, si sale cara, se saca una bola de la primera
urna; si sale cruz, se extrae de la segunda urna. Indique cuál es la
opción verdadera. (Operar en EXCEL o al menos con cinco decimales
en calculadora)

(a) La probabilidad de que haya salido cara y se haya extraído una bola azul,
es aproximadamente 0,25
(b) Si sólo se sabe que la bola obtenida es negra, la probabilidad de que dicha
bola estuviera en la primera urna es aproximadamente 0,474
(c) Si sólo se sabe que la bola obtenida es negra, la probabilidad de que dicha
bola estuviera en la primera urna es aproximadamente 0,374
(d) Ninguna de las anteriores es verdadera

Solución: La opción (b ).

Justificación: La opción (a) es fa lsa porque la probabilidad de que haya salido


cara y se haya extraído una bola azu l es 0,15. La opción (c) es falsa porque si
sólo se sabe que la bola obtenida es negra la probabilidad de que dicha bola
estuviera en la primera urna es aproximadamente 0,474. La opción (d) es
falsa porque la opción (b) es verdadera. A continuación se desarrollan los
cálculos real izados para obtener las soluciones correctas.

Cálculo: Si denominamos C al suceso salir cara al lanzar la moneda y X a salir


cruz, y nombramos N, A y V a los sucesos extraer una bola negra, azul y verde
respectivamente, obtenemos los resultados siguientes :
234 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE A DE

fXC)=~
2
fXX)=~
2
La primera probabilidad que hay que calcular es la de que haya salido cara y
se haya extraído una bola azul:

fX AI C) = fX Cn A) ~ fXCn A)= fXC)fX AI C) = ~ · _2_=_2_=0 1 5


fX C) 2 10 20 '
Análoga mente:
1 3 3
fXC n N)= fX C)fX NI C) =- ·-=-= 0.15
2 10 20
1 2 2 1
fX X n N) = fXX )fXNI X) =- ·-= -= -
2 6 12 6

A partir de las probabilidades anteriores, aplicamos el Teorema de Bayes para


obtener la otra probabilidad pedida que corresponde a que si sólo se sabe que
la bola obtenida es negra, la probabilidad de que dicha bola estuviera en la
primera urna.
P( eI N) = P( e(°'\ N) = P( e(°'\ N)
P(N) P(C,., N) + P(X"' N)
P(C)P(N! C) 320 ,,,0474
P(C)P(N! C)+ P(X)P(N I X) 3 +1 .
20 6

P.8.13. A partir de una encuesta sobre el número de aficionados al


club "campeón", se obtiene la siguiente información: el 18º/o de la
población total tiene estudios superiores, el 42º/o estudios medíos, el
30º/o estudios primarios y el 10º/o no tiene estudios. De entre los de
estudios superiores el 20º/o son aficionados del club, el 30°/o entre
los de estudios medios, el 35º/o entre los de estudios primarios y el
40°/o entre los que no tienen estudios. Si se extrae una persona al
azar, indique cuál es la opción verdadera.

(a) La probabilidad de que la persona elegida tenga estudios primarios o no


tenga estudios es 0,6
(b) La probabilidad de que la persona elegida sea una persona aficionada del
club "campeón " es 0,507
( c) La probabilidad de que, sabiendo que la persona elegida es aficionada del
club " campeón", tenga estudios superiores, es aproximadamente 0, 117
(d) Las opciones (b) y (c) son falsas.

Solución: La opción (c).


INTRODUCCIÓN A LA PROBABILIDAD 235

Justificación: La opción (a) es falsa porque la probabilidad de que la persona


elegida tenga estudios primarios o no tenga estudios es 0,40 . La opción (b) es
falsa porque la probabilidad de que la persona elegida sea una persona
aficionada del club "campeón" es aproximadamente 0,307. La opción (d) es
falsa porque la opción (c) es verdadera. A continuación se desarrollan los
cálculos realizados para obtener las soluciones correctas.

Cálculo: denominamos S, M, P y N a los sucesos, " extraer una persona con


estudios superiores"; "extraer una persona con estudios medios"; " extraer una
persona con estudios primarios"; "extraer una persona sin estudios",
respectivamente, y denotamos por A, al suceso ser aficionado del club
"campeón", y B, al suceso no ser aficionado del club "campeón". A
continuación se describe el método de cálculo empleado para obtener las
probabilidades que se solicitan en cada una de las cuestiones.

Conocemos las probabilidades siguientes:

P (S) = 0,18
P (M) = 0,42
P (P) = 0,30
P (N) = 0,10
P (A/ S) = 0,20
P (A/ M) = 0,30
P (A/ P) = 0,35
P (A/ N) = 0,40

(a) Para calcular la probabilidad de que la persona escogida "tenga estudios


primarios o que no tenga estudios", aplicamos la propiedad de la unión de
sucesos que se define de la forma siguiente:
P( P u N) = P( P) + M. N ) - M: Pn N ) . Teniendo en cuenta que se trata de
sucesos incompatibles y por tanto la probabilidad de su intersección es
nula, la probabilidad buscada es:

P( Pu N) = P(P) + P( N )- P( Pn N ) = P( P) + P(N) = 0,30 + 0,IO= 0,40

(b) Para calcular la probabilidad de que la persona escogida sea aficionada del
club " campeón", aplicamos el teorema de la probabilidad total, es decir:

P(A) = P( A / S)P( S) + P( A/ M )P( M ) + P( AI P)P(P)+ P( A I N )P(N)


Sustituyendo los valores correspondientes:

M: A)= 0,20 x 0,18 + 0.30 x 0,42 + 0,35 x 0,30 + 0,40 x 0,10 = 0,307
236 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE

(c) Para calcular la probabilidad de que la persona escogida, siendo aficionada


del club " campeón", tenga estudios superiores, aplicamos el Teorema de
Bayes. La probabilidad que se pide es la siguiente:

f{S! A)= f{A n S) = i9'S)x ¡;{ Al S) = O,l 8x 0,20 "° O 117


i9' A) i9' A) 0.307 '
BIBLIOGRAFiA 237

BIBLIOGRAFÍA

ARNALDOS, F.; DÍAZ, M.; FAURA, U.; MOLERA, M. y PARRA, l.: Estadística
Descriptiva para Economía y Administración de Empresas. AC, 2002.

ARNALDOS GARCÍA, F.: Estadística Descriptiva para Economía y


Administrae16n de Empresas: Cuestiones tipo test y ejercicios con Microsoft
Excel. Paraninfo, 2002. Thomson Paraninfo, 2003 .

ARIAS MARTÍN, C.; CARO RUIZ, J.; MÁRQUEZ DE LA PLATA Y CUEVAS, V.;
PAJARES RUIZ, A.: Distribuciones de frecuencias unidimensionales. Grupo
Editorial Atril 97 S. L., 1999.

ARIAS MARTÍN, C.; CARO RUIZ, J.; MÁRQUEZ DE LA PLATA Y CUEVAS; V.;
PAJARES RUIZ, A. : Distribuciones de frecuencias bidimensionales. Edición
Digital @tres, S.L.L., 2000.

ARIAS MARTÍN, C.; CARO RUIZ, J.; GONZÁLEZ GONZÁLEZ, A.; MÁRQUEZ DE
LA PLATA Y CUEVAS, V.; PAJARES RUIZ, A.: Lecciones de Estadística
Descriptiva. Edición Digital @tres, S. L. L., 2001.

CALOT, G.: Curso de Estadística Descriptiva. Paraninfo, 1988.

CASA ARUTA, E.: 200 Problemas de Estadística Descriptiva. Vicens Vives,


1994.

CASAS SÁNCHEZ, J. M.; SANTOS PEÑA, J. : Introducc16n a la Estadística para


Administrae16n y Dirección de Empresas. Editorial Centro de Estudios Ramón
Areces, 2002 .

CASAS SÁNCHEZ, J. M.; GARCÍA PÉREZ, C.; RIVERA GARCÍA, L. F.: Problemas
de estadística: descriptiva/ probabilidad e inferencia. Pirámide, 1998.

ESCUDER VALLÉS, R.: Métodos estadísticos aplicados a la economía. Ariel,


1987.

ESTEBAN GARCÍA, J. y otros: Estadística Descriptiva y nociones de


Probabilidad. Thomson, Madrid, 2005.

FERNÁNDEZ CUESTA, C.; FUENTES GARCÍA, F. : Curso de estadística


descriptiva: teoría y práctica. Ariel, 1995.

GARCÍA BARBANCHO, A.: Estadística elemental moderna. Ariel, 1992.


238 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE AD E

LIPSCHUTZ, SEYMOUR : Introducción a la probabilidad y estadística. McGraw-


Hill, D.L. 2001. Colección Schaum.

LÓPEZ CACHERO, M.: Fundamentos y métodos de estadlstica. Pirámide, 1996.

MARTÍN-GUZMÁN CONEJO, M. P.; MARTÍN PLIEGO, F. J. : Curso básico de


Estadística Económica. AC, 1993.

MARTÍN PLIEGO, F.J .: Curso práctico de Estadística Económica. AC, 1994.

MARTÍN PLIEGO, F.J.: Introducción a la estadlstica económica y empresaria/:


teor/a y práctica. AC, 2000.

MONTIEL, A, M.; RIUS, F.; BARÓN, F. J.: Elementos básicos de Estadlstica


Económica y Empresarial. Prentice Hall, 1996.

MUÑOZ ALAMILLOS, A.; VICENTE VÍRSEDA, J.A.; MUÑOZ MARTÍNEZ, A.:


Estadística para la Administración y Dirección de Empresas. Ediciones
Académicas, S.A. ( EDIASA), 2010 .

OTERO, J. M.: Econometr/a. Series Temporales y predicción. AC, 1985.

PEÑA SÁNCHEZ DE RIVERA, D. : Estadística. Modelos y métodos: l.


Fundamentos. Alianza Universidad, 1986.

PEÑA SÁNCHEZ DE RIVERA, D. : Fundamentos de Estadlstica. Alianza


Universidad, 2001.

PÉREZ LÓPEZ, C.: Estadística: problemas resueltos y aplicaciones. Pearson


Educación, 2003.

PÉREZ SUÁREZ, R.: Análisis de datos económicos. Pirámide, 1999.

RODRÍGUEZ MORILLA, C.: Análisis de series temporales. Editoria l La Muralla,


Madrid 2000.

SARABIA ALEGRÍA, J . M. : Curso práctico de estadística. Civitas Ediciones,


2000.

SANTOS PEÑAS, J.; MUÑOZ ALAMILLOS, Á.: Ejercicios de estadlstica aplicada.


Ediciones Académicas, 2003 .

SANTOS PEÑAS, MUÑOZ A. Y OTROS: Estadística para Estudios de Turismo.


Editorial Ediciones Académicas, SA. Año 2007.
BIBLIOGRAFÍA 239

SPIEGEL, M. R. : Estad/stica. McGraw Hill, 1991.

TOMEO PERUCHA, V.; UÑA JUÁREZ, l. : Lecciones de estad/stica descriptiva.


Thomson Paraninfo, 2003.

URIEL JIMÉNEZ, E.; MUÑIZ, M.: Estad/stica Económica y Empresarial. AC,


1993.

YULE, G.; KENDALL, M.: Introducción a la Estad/stica Económica ( Tomo!).


Aguilar, 1967.

ISBN 84- 9 2477-87 - 3

1 1 """"
9 788492 1

También podría gustarte