Documentos de Académico
Documentos de Profesional
Documentos de Cultura
. •
EJERCICIOS DE TEST
I •
RESUELTOS PARA
INTRODUCCIÓN A LA
ESTADÍSTICA DE
ADMINISTRACIÓN Y
DIRECCIÓN DE EMPRESAS
.....
Un ED ~ EDICIONES ACADÉMICAS
-
«Cualquier forma de reproducción, distribución, comunicación pública o
transformación de esta obra solo puede ser realizada con la autorización de
sus titulares, salvo excepción prevista por la ley. Diríjase a CEDRO (Cen-
tro Español de Derechos Reprográficos) si necesita fotocopiar o escanear
algún fragmento de esta obra (www.conlicencia.com ; 91 702 19 70 I
93 272 04 47)».
ISBN : 978-84-92477-87-6
Depósito Legal : M-34726-2013
PRÓLOGO
CAPÍTULO l. INTRODUCCIÓN .............................. ..... .. .... .............................. 1
CAPÍTULO 2. DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES ........ 19
2.1. Preguntas Teóricas .................................................................... ..... 19
2.2 . Problemas ..... ...................................................... ....... ........ ............ 25
CAPÍTULO 3. LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES
UNIDIMENSIONALES ................. ............................................................ 37
3.1. Preguntas teóricas ............ ...... ............. ......... .................................. 37
3.2. Problemas .......................... ......................................................... ... 44
CAPÍTULO 4. LAS MEDIDAS DE DISPERSIÓN, DE FORMA Y CONCENTRACIÓN
EN DISTRIBUCIONES UNIDIMENSIONALES.............. ............................... 56
4.1. Preguntas Teóricas ......................................................................... 56
4.2. Problemas .............. ........................................................................ 68
CAPÍTULO 5. DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES.
REGRESIÓN Y CORRELACIÓN ............................................................... 91
5.1. Preguntas Teóricas ................................................ .................... ... .. 91
5.2. Problemas .. .................... ..... .................... .......... ........................... 101
CAPÍTULO 6. NÚMEROS ÍNDICES ..... ............... ............ ........................ .. ..... 129
6.1. Preguntas Teóricas .......... ... ..................... .............. .................. ..... 129
6.2. Problemas ........................ .. ......................................................... . 144
CAPÍTULO 7. SERIES TEMPORALES .... ......................... ........ .................. ..... 169
7.1. Preguntas Teóricas .......... ... ............................. .. ...... ..................... 169
7.2. Problemas ....................... .... ............................ ............................. 179
CAPÍTULO 8. INTRODUCCIÓN A LA PROBABILIDAD .................................... 211
8.1 . Preguntas Teóricas ................. ........................... ... .. ...................... 211
8.2. Problemas .................................................................................... 221
BIBLIOGRAFÍA ......... .............................. ........................ ....... .................... 237
PRÓLOGO
CAPÍTULO 1. INTRODUCCIÓN
En este tipo de preguntas hay que tener en cuenta que la mayor parte de las
variables continuas pueden tratarse como discretas; así, por ejemplo, si
valoramos la altura de los habitantes de Madrid en cm., despreciando las
unidades menores y la mide una misma persona con el mismo metro, una
2 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
Solución: La opción (b ).
Justificación: La opción (b) es falsa porque son los atributos quienes pueden
clasificarse como ordenables y no ordenables.
(a) La Inferencia Estadística estudia los métodos empleados para inferir algo
acerca de una población basándose en la información aportada por una
parte del colectivo
(b) Los parámetros son las características poblacionales que deseamos
investigar y que suelen ser desconocidas a priori
(c) Las opciones (a) y (b) son verdaderas
(d) Los atributos son las características o parámetros numéricos de la
población y pueden ser discretos o continuos
(a) El número de viajes de trabajo realizados por una persona el último año es
una variable Cuantitativa
(b) El porcentaje de audiencia de los prog ramas de televisión durante la
semana pasada es una variable Cuantitativa
(c) El lugar de nacimiento de los estudiantes de la UNED es una variable
Cuantitativa
(d) El Grado de satisfacción de los clientes con el servicio telefónico es una
variable Cualitativa
T.1 .8. En relación con las funciones del EUROSTAT, indique la opción
verdadera.
(a) El EUROSTAT genera, verifica y analiza sus datos y los envía a las
autoridades estadísticas de los Estados Miembros
(b) El EUROSTAT fija el tipo de interés para los países de la eurozona
( c) Son las autoridades estadísticas de los Estados Miembros las que generan,
verifican y analizan los datos nacionales y los envían a Eurostat
(d) Ninguna de las anteriores es verdadera
Justificación: La opción (a) es falsa porque aparte del INE existen otros
organismos que llevan a cabo operaciones estadísticas. Así, la información
tributaria y los resultados de Comercio Exterior dependen del Ministerio de
Hacienda, las Estadísticas de la construcción del Ministerio de Fomento, etc. La
opción ( c) es falsa porque las fuentes primarias son las elaboradas
específicamente para la propia investigación. La opción (d) es falsa porque la
opción (b) es verdadera .
INTRODUCCIÓN 5
Justificación: La opción (b) es falsa porque para la realización del catastro son
necesarias las investigaciones censales, debiendo disponerse de información
detallada de todos y cada uno de los individuos a fin de fijar la cuota
impositiva que le corresponda.
Justificación: La opción (c) es fa lsa porque las opciones (a) y (b) son
verdaderas.
Solución: La opción (b ).
Solución: La opción (b ).
Solución: La opción (b ).
Solución: La opción (b ).
Solución: La opción (b ).
(a) Es una Encuesta que realiza el INE a las empresas encuadradas en los
diversos subsectores del sector de servicios; tiene carácter trimestral y
permite fundamentalmente estimar el empleo y el desempleo en cada
sector de actividad de la economía española
(b) Es una Encuesta que realiza el INE a las empresas encuadradas en los
diversos subsectores del sector de servicios; tiene periodicidad anual y
permite estimar las variables macroeconómicas del sector y su
contribución al PIB y a la contabilidad nacional a partir de la información
que suministran las empresas del sector servicios de España
( c) Es una Encuesta elaborada con periodicidad por el Ministerio de Economía
y Competitividad y que tiene por fin conocer la estructura del sector para
decidir las políticas a seguir en relación con la mejora del mismo
(d) Ninguna de las opciones es correcta
Solución: La opción (b ).
(a) Unidimensionales
(b) Bidimensionales
(c) Multidimensionales
(d) Ninguna de las opciones es verdadera
Justificac16n: Las opciones (b) y (c) son fa lsas porque por definición el
cociente entre la frecuencia absoluta de un valor y el número total de
observaciones o datos recibe el nombre de frecuencia relativa. La opción (d)
es falsa porque la opción (a) es verdadera .
Justificación: Las opciones (b) y ( c) son falsas porque por definición la suma
de frecuencias relativas es siem pre 1. La opción (d) es falsa porque la opción
(a) es verdadera.
(a) 1
(b) 6
( c) Ninguna de las otras soluciones es correcta
(d) o
Solución: La opción (a).
Justificación: Las opciones (b) y (d) son falsas porque por definición la suma
de frecuencias relativas es siem pre 1. La opción (c) es falsa porque la opción
(a) es verdadera .
Justificación: Las opciones (b), (c) y (d) son falsas porque, por definición, el
número de veces que se presenta un valor (sí se trata de una variable) o un
carácter o modalidad (sí se trata de un atributo) se conoce con el nombre de
Frecuencia absoluta.
Justificación: Las opciones (a), (c) y (d) son falsas porque, por definición, las
distribuciones de frecuencias de tipo 1 son aquellas en las que los valores de la
variable no se repiten.
Justificación: Las opciones (a), (b) y (d) son falsas porque, por definición, las
distribuciones de frecuencias de tipo 11 son aquellas en las que cada valor de
la característica medida se repite un determinado número de veces.
Justificación: Las opciones (a), (b) y ( d) son falsas porque el intervalo (8, 10),
se define como abierto por el extremo inferior y cerrado por el extremo
superior.
(a) La amplitud del intervalo se calcula como la diferencia entre los dos
extremos del intervalo
(b) La marca de clase coincide con el límite superior del intervalo
( c) La amplitud de los intervalos siempre es la misma
(d) Un dato puede estar contenido en dos intervalos distintos
Justificación: La opción (a) es falsa porq ue los puntos del eje de abscisas en
los polígonos de frecuencias corresponden a las marcas de clase de los
intervalos. La opción (b) es falsa porque en los gráficos de sectores el área de
cada sector es proporcional a las frecuencias absolutas de cada modalidad. La
opción (c) es falsa porque en los diagramas de tallos y hojas comenzamos
seleccionando los tallos; a continuación efectuamos un recuento y vamos
«añadiendo» cada hoja a su tallo; y por último reordena mos las hojas,
terminando así el diagrama.
T.2.12. En un histograma:
Justificao6n: Las opciones (a) y (c) son falsas porque en un histograma, las
alturas de los rectángulos se calculan de tal forma que el área del rectángulo
sea proporcional a la frecuencia de cada clase . La opción (d) es falsa porque la
opción (b) es verdadera.
interés. La opción (b) es falsa porque la marca de cada clase se obtiene como
el punto medio de cada intervalo. La opción ( c) es falsa porque en los
histogramas, la representación es un conjunto de rectángulos donde cada uno
representa una clase; la base de los rectángulos es igual a la amplitud del
intervalo y la altura se determina de forma que el área del rectángulo sea
proporcional a la frecuencia de cada clase.
(a) El histograma
(b) El pictograma
(c) Diagrama de sectores
(d) Gráfico de barras
2.2. Problemas
Empleado 1 2 3 4 5 6 7 8 9 10
Oficinas 1 4 1 3 3 2 1 1 1 3
Empleado 11 12 13 14 15 16 17 18 19 20
Oficinas 4 4 2 2 1 1 2 4 4 1
Para obtener las frecuencias relativas deben dividirse las frecuencias absolutas
por el número total de observaciones. La información demandada sería, por
tanto, la siguiente:
850 1265 895 575 2410 470 660 1820 1510 1100
620 425 751 965 840 1505 1375 695 1125 1475
Solución:
2 1 9
3 4 7
4 2 6 7 6
5 9 7 5
6 9 4 o 9 5 9 9 8 6
7 7 5 3 4 o 4 5
8 7 1 7 1 2 6 7 1 2
9 7 1 o 4
21 29 34 37 42 46 47 46 59 57
55 69 64 60 69 65 69 69 68 66
77 75 73 74 70 74 75 87 81 87
81 82 86 87 81 82 97 91 90 94
Número obtenido 1 2 3 4 5 6
Nº de veces que aparece dicho número 2 3 5 5 1 4
3
Número obtenido 1 2 3 4 5 6
i
Nº de veces que aparece dicho número 2 3 5 5 1 4
¿x n 1 1
X = x1n1+X2 n2+ X3n3+ .......+x6n6 = f;1 = 72 = 36
,
n1 + n1 + n3+ ....... + n6 N 20
( Li-1- L¡] n¡
20-30 14
30-40 4
40-50 9
50-60 3
30 EJERCIC IOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE
:o
-.
} 10
'•
X¡ n¡ X¡ * n ¡ N¡
1 2 2 2
2 2 4 4
3 4 12 8
4 5 20 13
5 8 40 21
6 9 54 30
7 4 28 34
8 3 24 37
9 2 18 39
10 1 10 40
SUMA N = 40 212
A partir de la tabla anterior, se deduce que los alumnos suspensos son 13,
valor que corresponde a N4 •
La nota más común es 6, por lo que un alumno que hubiese obtenido la nota
más común no habría suspendido.
X¡ n¡ f¡
2 10 0,25
3
4 15 0,375
5 0,25
32 EJERCIC IOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
Para calcular la frecuencia relativa que falta, aplicamos que la suma de las
frecuencias relativas ha de ser la unidad, luego el valor de la frecuencia
relativa que faltaba , correspondiente a x = 3, ha de ser = 1 - (0,25 + 0,375 +
0,25) = 1 - 0,875 = 0,125
Para calcular las frecuencias absolutas que faltan, por ejemplo, en el caso de x
= 5, basta con resolver la siguiente ecuación correspondiente a la frecuencia
relativa: n5/ 40 = 0,25. De cuyo resultado se obtiene n5 = 10.
X¡ n¡ N¡ f¡
2 10 10 0,25
3 5 15 0, 125
4 15 30 0,375
5 10 40 0,25
37 29 25 38 16 14 31 37 33 28 28 23 17
Solución: La opción (b ).
14 16 17 23 25 28 28 29 31 33 37 37 38
Tallos Ho ·as
1 4 6 7
2 3 5 8 8 9
3 1 3 7 7 8
( L¡. 1 - L¡] n¡
20-30 14
30-40 4
40-50 9
50-60 3
(a) 13,3%
(b) 60%
(c) 19%
(d) Ninguna de las soluciones es correcta
Solución: La opción (b ).
( L¡. 1 - L¡J n¡
20-30 14
30-40 4
40-50 9
50-60 3
(a) 59,99%
(b) 18%
(c) 30%
(d) Ninguna de las soluciones es correcta
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 35
52 50 38 42 48 55 52 51 36 47 52 53 57
56 35 36 58 49 46 50 49 52 38 41 55 48
59 49
Ordenados los datos, se observa que varían entre 35 y 59; hay cinco
intervalos, el primer intervalo es [35-40) y el último el [55-60). Por tanto, la
tabla de frecuencias será la siguiente:
Frecuencias
Intervalo Frecuencias Frecuencias Frecuencias relativas relativas
de Clase absolutas acumuladas en porcentaje acumuladas en
[L¡_ 1 - L¡) (n¡) (N¡) (f¡) porcentaje
(F¡)
35-40 5 5 (5/ 28)*100) = 17,9% 17,9%
40-45 2 7 (2/28)*100) = 7,1% 25,0%
45-50 7 14 (7/ 28)* 100) = 25,0% 50,0%
50-55 8 22 (8/28)*100) = 28,6% 78,6%
55-60 6 28 (6/28)* 100) = 21,4% 100,0%
(a) La media armónica no debe emplearse cua ndo la variable está medida en
unidades relativas
(b) Sólo se puede calcular si no hay observaciones nulas
(c) Los valores extremos t ienen una menor influ encia que en la media
aritmética
(d) Es más representativa que ot ras medidas en los casos de obtener
promedios de velocidades, rendimientos y productividades
(a) Los cuantiles son los valores de la variable que dividen una distribución de
frecuencias en partes iguales
(b) Los cuartiles son cuatro valores que dividen a la serie de datos en cinco
partes iguales
(c) La mediana coincide con el segundo decil.
(d) Ninguna de las demás opciones es correcta
Solución: La opción (b ).
Justificación: La opción (b) es falsa porque los cuarti les son tres valores que
dividen a la serie de datos en cuatro partes iguales.
1 ~ ! ~ ~
1 1 1 1 ; 1 ! 1
X¡ n¡ X¡.n¡ N¡
1 3 3 3
2 2 4 5
3 7 21 12
4 5 20 17
5 4 20 21
SUMA= N = 21 SUMA= 68
3.2. Problemas
10
¿ x,
La media aritmética se calcula de la forma siguiente: X =_,__, - = 33 = 3,3
10 10
6
¿ x,
1• 1 - = ~ = 3
Cuyo valor es el siguiente : x =-
6 6
o
1
¿ x,
1~1 32 3 2
euyo va1ores: -
X=IO =TO= ,
¿xi
X=.M_= 615
8 ,
Para obtener la media winsorizada a nivel 1, los datos 1,2 y 6,1 se sustituyen
por 2,1 y 5,7 respectivamente. Es decir, calcularemos la media de los
siguientes datos.
8
_Lx¡
Cuyo valor es: X = i=~ = 3,4 7 5
¿x,
Cuyo valor es: X =~=
4 3 05 I
8
¿ x,
Cuyo valor es: X = ....!::!._
8 =3 , 125
1 1
2 1 1 2 2 3 2 1
3 3 5 3 3 3
4 1 1
X¡ n¡ N¡ X¡* n ¡
11 1 1 11
21 3 4 63
22 3 7 66
23 1 8 23
33 4 12 132
35 1 13 35
41 2 15 82
SUMA= 15 SUMA = 412
1 7 1 1 1 3 1 7 1 3 7
Solución: La opción (b ).
1 1 1 3 1 3 1 7 1 7 1 7 1
L,_ , - L, (n¡)
[O - 5) 1.000
[5 - 10) 2.200
[10 - 15) 4.300
[15-20) 3.300
50 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
X¡ 1 2 3 4 5 6 7 8 9 10
n¡ 2 7 8 8 22 3 13 17 7 13
( a) La media es menor de 5
( b) La diferencia entre la mediana y el segundo cuartil es 3
(c) El valor del tercer cuartil es 8
(d) Ninguna de las demás opciones es correcta
X¡ n¡ N¡ X¡* n¡
1 2 2 2
2 7 9 14
3 8 17 24
4 8 25 32
5 22 47 110
6 3 50 18
7 13 63 91
8 17 80 136
9 7 87 63
10 13 100 130
SUMA= 100 SUMA= 620
¿x¡n¡
X= i=I = 620 = 6 2
N 10 0 '
52 EJERCICIOS DE TEST PARA INTRODU CCIÓN A LA ESTADISTICA DE ADE
Al existir un valor que coi ncide con 50 en la columna de Ni, que corresponde
al valor de la variable xi = 6; el valor del segundo cuartil corresponde a la
6 +7
semisuma de 6 y 7. Es decir, 02 = - - = 6,5
2
1 3 1 1 1 1 1 2 1 2 1 o o
1
1 o o
1 1 1 1 1 2
1 1 2 1 3 1
x= o+ o + 1+ 1+ 2 + 2 + 3 ~ 129
7 '
La media geométrica no puede calcularse al existir un valor nulo.
(a) Más de la mitad de los clientes han dado puntuaciones iguales o superiores
a 5,5.
(b) La med ia na y la media aritmética coinciden
{c) La mediana es mayor que la media aritmética
{d) La mediana es menor que la media aritmética
X¡ n¡ N; X;* n ¡
1 2 2 2
2 3 5 6
3 4 9 12
4 11 20 44
5 45 65 225
6 7 72 42
7 13 85 91
8 7 92 56
9 5 97 45
10 3 100 30
SUMA = 553
X; n; N; X;* n ;
1 2 2 2
2 3 5 6
3 4 9 12
4 11 20 44
5 45 65 225
6 7 72 42
7 13 85 91
8 7 92 56
9 5 97 45
10 3 100 30
SUMA= 553
3 300
Para el cálcu lo del tercer cuartil Q3 se obtiene: ·N = = 75
4 4
Justificación: La opción (a) es falsa porque las medidas de dispersión son las
que investigan la distancia entre los valores de la distribución y los valores
centrales. La opción (b) es falsa porque las medidas de posición pueden ser
insuficientes para resumir las características de una distribución. La opción (d)
es falsa porque la opción (c) es verdadera.
Justificación: Las opciones (a), (b) y (c) son falsas porque el rango de una
distribución se define como la diferencia entre el mayor y el menor valor de la
distribución.
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 57
Solución: La opción (b ).
Justificación: La opción (a) es falsa porque los deciles son una medida de
posición. La opción (c) es falsa porque el rango entre percentiles se define
como la diferencia entre el percentil 90 y el 10. La opción (d) es fa lsa porque
la opción (b) es verdadera.
(a) Una desviación típica pequeña significa que todos los valores de la
distribución se sitúan próximos a la media
(b) Ninguna de las demás opciones es correcta
(c) La varianza de una distribución se define como la mediana de los
cuadrados de las desviaciones respecto a la media;
(d) La desviación mediana se define como la media de los valores absolutos
de las desviaciones respecto a la media aritmética
(a) Una desviación típica pequeña significa que todos los valores de la
distribución se sitúan próximos a la media
(b) La desviación típica es siempre mayor o igual que cero
(e) La desviación típica está afectada por cambios de escala
(d) La desviación típica está afectada por cambios de origen
(a) Una desviación típica grande significa que todos los valores de la
distribución se sitúan próximos a la media
(b) La desviación típica puede ser menor que cero
(e) La desviación típica está afectada por cambios de escala
(d) La desviación típica está afectada por cambios de origen
Solución: La opción (b ).
60 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
{a) Las medidas de asimetría son medidas que tratan de indicar el grado de
simetría con el que se agrupan los valores de una distribución en torno a
sus medidas centrales
ro) El Coeficiente de asimetría de Fisher, está relacionado con la mediana y
con los cuartiles
' e) El Coeficiente de asimetría de Bowley está basado en el momento de
segundo orden
(d) Ninguna de las anteriores es correcta
(a) Las medidas de curtosis son medidas que tratan de indicar el grado de
simetría con el que se agrupan los valores de una distribución en torno a
sus medidas centrales
(b) Las medidas de apuntamiento o curtosis tratan de estudiar la distribución
de frecuencias en la zona media, es decir, el mayor o menor número de
valores de la variable alrededor de la mediana
( c) El Coeficiente de Curtosis de Fisher mide el grado de apuntamiento de la
distribución
( d) Ninguna de las anteriores es correcta
Justificación: Las opciones (a) y (b) son falsas porque las medidas de
apuntamiento o curtosis tratan de estudiar la distribución de frecuencias en la
zona media, es decir, el mayor o menor número de valores de la variable
alrededor de la media dará lugar a una distribución más o menos apuntada. La
opción (d) es falsa porque la opción (c) es correcta.
(a) Posición
(b) Simetría
(c) Dispersión
(d) Ninguna de las anteriores es correcta
Justificación: Las opciones (a) y (b) son falsas porque la desviación típica es
una medida de dispersión. La opción (d) es falsa porque la opción (c) es
correcta.
(a) Curtosis
(b) Tendencia central
( c) Dispersión
(d) Las opciones (a) y (c) son verdaderas
Justificación: Las opciones (a) y (b) son falsas porque el rango intercuartílico
es una medida de dispersión . La opción (d) es falsa porque la opción (a) es
falsa.
Justificación: Las opciones (a), (b) y (d) son falsas porque la varianza de una
1ariable sólo se ve afectada por los cambios de escala, no así de origen.
Justificaciórr. Las opciones (a), (b) y (d) son falsas porque si el coeficiente de
rurtosis de Fisher es igual a O, la distribución es mesocúrtica.
La opción (c) es falsa porque el índice de Gini puede ser menor que l. La
opción (d) es falsa porque la opción (a) es verdadera .
1
a) Permite poner de relieve el grado de igualdad o equidad en la distribución
del total de los valores de una variable
ro) Es una medida de posición de una distribución
' e) Toma valores entre O y 1, coincidiendo el O con la concentración máxima y
el 1 con la concentración mínima
' d) Ninguna de las afirmaciones es verdadera
(a) Si la curva de Lorenz coincide con la línea de 45 grados que pasa por el
origen, el Índice de Gini toma el valor 1
(b) Para dibujar la curva de Lorenz, en el eje de abscisas se representa la
población ordenada de forma que los percentiles de renta más alta quedan
a la izq uierda y los de renta más baja quedan a la derecha
(c) El Índice de Gini no puede tomar el va lor O
(d) Ninguna de las respuest as es verdadera
(a) La curva de Lorenz coincide con el eje horizontal hasta el pu nto (100,0)
donde salta al punto (100,100)
(b) El va lor del índice de Gini es cero
(c) El coeficiente de variación es próximo a 1
(d) Ninguna de las anteriores
Solución: La opción (b ).
4.2. Problemas
X¡ 1 2 3 4 5 6 7 8 9 10
n¡ 2 7 8 8 22 3 13 17 7 13
(a) El rango es 9
(b) El coeficiente de apertura toma el valor 10
( c) El valor de la desviación media es 2,8
(d) Las opciones (a) y (b) son verdaderas
X¡ n¡ N¡ X;* n ¡
1 2 2 2
2 7 9 14
3 8 17 24
4 8 25 32
5 22 47 110
6 3 so 18
7 13 63 91
8 17 80 136
9 7 87 63
10 13 100 130
SUMA= 100 SUMA= 620
-
X¡ n; Ni Xt·*n X, - X lx,- ~ ¡x,- * ,
1 2 2 2 -5,2 5,2 10,4
2 7 9 14 -4,2 4,2 29,4
3 8 17 24 -3,2 3,2 25,6
4 8 25 32 -2,2 2,2 17,6
5 22 47 110 -1,2 1,2 26,4
6 3 so 18 -0,2 0,2 0,6
1 7 13 63 91 0,8 0,8 10,4
1 8 17 80 136 1,8 1,8 30,6
'
1 9 7 87 63 2,8 2,8 19,6
1 10 13 100 130 3,8 3,8 49,4
SUMA =1 00 SUMA =620 SUMA =220
X¡ n¡ N¡ X¡* n ¡
1 3 3 3
2 5 8 10
3 6 14 18
4 4 18 16
5 2 20 10
SUMA =20 SUMA =57
El rango se define como la diferencia entre el mayor (5) y el menor valor (1)
de la distribución, es decir: Rx = x5 - x 1 = 5 -1 = 4
1 ~ ~ ~
1 1 1 : 1 : 1 ~ 1
X¡ n¡ N¡ X¡* n¡
1 3 3 3
2 5 8 10
3 6 14 18
4 4 18 16
5 2 20 10
SUMA= 20 SUMA= 57
1- 5
¿ x,n,
X=l=I- - = -57
-
= ?85
-·
N 20
-
X¡ n¡ N¡ X¡* n ¡ X, - X lx, - ~ X¡- Xfl,
20
I xA
X= i~I = 57=2 85
N 20 '
• Conocida la media aritmética, en la cuarta columna se obtiene, el valor
de x, -x; para ello se ha procedido a restar a cada va lor de la variable
la media aritmética de la distribución.
• En la quinta columna se ha realizado la operación ( X¡ - x)n, 1 simplemente
20
paracomprobarquesecumple: :L<x,- x) n, =O
1-1
I <x¡- x) 2n; 28 55
u2 = t~I 1,428 :::::--'-:::::
X N 20
La desviación típica se calcula como la raíz cuadra da positiva de la varianza:
Nº de Nº de Nº de
Salario Mensual
trabajadores de trabajadores de trabajadores de
en euros
la Empresa A la Empresa B la Empresa C
(500-800] 20 150 120
(800-1.200] 300 200 220
(1.200-1.600] 190 100 60
(1.600-2.000] 50 110 160
(a) La primera empresa A tiene una concentración de salarios más alta que la
segunda empresa
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 75
(b) La segunda empresa B tiene una concentración de salarios más alta que la
tercera empresa
(c) La tercera empresa C tiene una concentración de salarios más alta que la
primera empresa
(d) Ninguna de las demás opciones es correcta
_m1:>resa A
E m
c....
(L1-1,L1] n, N¡ p1= (N¡/N)* lOO X¡ X¡ n; U¡ Q¡ p¡ - Q¡ m
:::o
()
(400-8001 20 20 3 571429 600 12.000 12.000 1 796407 1,775021 o
(800-1.2001 300 320 57 142857 1000 300.000 312.000 46 706587 10,436270 6
(/)
(1.200-1.6001 190 510 91 071429 1400 266.000 578.000 86 526946 4 544482 o
(1.600-2.000] 50 560 100 1800 90.000 668.000 100 o m
-1
n 1 ni
m
Suma N =560 ¿ p, = 151,785714 668.000 ¿ (p,- q,)= 16,755774 (/)
11 1 1 -1
-u
Empresa B )>
_m1 >resa e
E ~
m
(/)
{L¡.1,L¡] n¡ N¡ p;= (N¡/N)* lOO X¡ X¡ n¡ Q¡ p ¡ - Q¡
~
U¡
En las que:
°L(P;- q,)
I GA = _,;_1- -- 16 ' 75 5 77 4 "' o1 104
n-1
151.7857 14 '
LP;
n-1
¿ (p,- q,) -
/G = ¡'; 1 = 40,66196'.>"' 2397
0
B n-l 169642857 '
¿ p, '
/; I
42 , 125645 "'0.2743
153,571429
L P1
1- 1
Nº
Marca
Nº de acumulado Total de
de
clase
empleados de salarios p, =L.; x, n, p, = ~ 100 Q, = ~ 100
Jln
p ¡ - Q¡
n, empleados n,·x,
X,
N,
1.000 230 230 230.000 230.000 46 25,27 20,73
2.000 160 390 320.000 550.000 78 60,44 17,56
3.000 80 470 240.000 790.000 94 86,81 7, 19
4.000 30 500 120.000 910.000 100 100 o
n-1 11-1
N =500 P n = 910.000
¿_ p,= L (P;- Q,)
I 1 l• I
218 = 45,47
n- 1
"¿) P, - Q, ) 45 47
/ = /~ I =-'-:::::0 2 1
218 '
G
¿p,
n 1
I 1
de la línea de 45 grados que pasa por el origen . La opción (b) es falsa porque
después de la reducción de plantilla, el índice de Gini ha aumentado en
aproximadamente 0,01. La opción (c) es falsa porque antes de la reducción de
plantilla, el índice de Gini de la distribución de salarios es menor que 0,22.
Marca Nº Total
Nº de
de acumulado de de
empleados j11 = ¿ x, n, p = ~ 1 00 Q, = ~ 1 00 p,. - q,.
clase empleados salarios ' N jln
n,
X, N, n,·x,
1.000 290 290 290.000 290.000 58 38,16 19,84
2.000 170 460 340.000 630.000 92 82,89 9,11
3.000 30 490 90.000 720.000 98 94,74 3,26
4.000 10 500 40.000 760 .000 100 100 o
n-1 n 1
jln = 760.0 PQ ¿ p, L ( P, - q,)
N = 500 H l=I
= 248 = 32,21
n- 1
Nº
Marca
Nº de acumulado Total de
de
empleados de salarios ji,= ¿ x, n, p, = ~ 100 Q, =..&wo p,. - q,.
clase jl n
n, empleados n,·X,
X,
N,
1.000 290 290 290.000 290.000 64,44 43,94 20,51
2.000 120 410 240.000 530.000 91,11 80,30 10,81
3.000 30 440 90.000 620.000 97,78 93,94 3,84
4.000 10 450 40.000 660.000 100 100 o
n-1
¿ p, n- 1
L(P, - Q¡)
N = 450 jl 0 = 660.000 t- 1
/=)
=
= 35,15
253,33
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 81
n 1
9¡ U¡
p¡
PAIS A PAÍS B
20 3,23 5,34
40 7,04 9,75
60 12,15 14,23
80 20,75 21,02
100 56,83 49,66
(a) El índice de Gini del país B es mayor que 0,35 y menor que 0,65
(b) La diferencia entre los índices de Gini de ambos países es menor que 0,3
(en valor absoluto)
(c) La distribución de la renta del país A es menos equitativa, es decir, más
concentrada que la del país B
(d) La curva de Lorentz del país A está más próxima a la línea de 45 grados
que pasa por el origen que la curva de Lorentz del país B
Justificación: La opción (d) es falsa porque los Índices de Gini de los pa íses A
y B son respectivamente 0,60 y. 0,50 y por tanto la distribución de la renta del
país A es menos equitativa, o más concentrada, que la del país B, y la curva
de Lorentz del país A está menos próxima a la línea de 45 grados que pasa
por el origen que la curva de Lorentz del país B.
n-1
L) P1- Q; )
/ -~'=~I_ __
G - n-1
L P;
i=I
En la que p; y q; son los porcentajes acumulados de población y de renta,
respectivamente, por estratos de menor a mayor.
µ, Q, = _Jl,_100
Q, =_Jl,_100
1/, Pn p ¡ - Q¡ µ. Pi,- Q;
PAÍS p¡ í
PAÍS A í PAÍS A PAIS B
B PAÍS B
PAÍS A
3,23 5,34 20 3,23 16,77 5,34 14,66
7,04 9,75 40 10,27 29,73 15,09 24,91
12,15 14,23 60 22,42 37,58 29,32 30,68
20,75 21,02 80 43,17 36,83 50,34 29,66
56,83 49,66 100 100 o 100 o
fl-1 fl-1 n-1
n- 1
G 200 .
'L,<P, - q, )
/G = -'-'-'=~I n-,-- 99,9 1 ,,,,050
200 ,
L, p,
11
A partir de los resultados obtenidos, cabe concluir que al ser el IG del país A
mayor que el del país B, la distribución de la renta es menos equitativa o más
concentrada en el país A que en el país B.
Nº
Marca
Nº de acumulado Total de
de
clase
empleados de salarios µ, = ¿ x, n, p = ~ 100 q =~ 100
Jln
p ¡ - Q¡
n, empleados n,·x,
X,
N,
750 50 50 37.500 37.500 10 4,29 5,71
1.250 100 150 125.000 162.500 30 18,57 11,43
1.750 200 350 350.000 512 .500 70 58,57 11,43
2.250 100 450 225.000 737 .500 90 84,29 5,71
2.750 50 500 137.500 875 .000 100 100 o
n-J 11-I
µ n = 875.000
l, P, L (P,- q,)
N =500 l=l 1·1
= 200 = 34, 29
84 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
ni
L )P, - q,) 34 29
'ª = ,_, n 1
= _200
.- ~ 0.17
L P1
'1
Nº
Marca
Nº de acumulado Total de
de
empleados de salarios p , =¿ x, n, p, = ~ 100 q, =~ 100 p¡ - q¡
clase fi n
n, empleados n·x
x, 1 '
N,
I <P,- Q,)
1-1
N = 440 Jln = 725.000 l=I
=
= 29,76
220,45
n-1
L (p,- q, ) 29.76
f - i =I = --"='0 ) 4
n 1 220.45 '
G -
¿p,
,_,
Número de t rabajadores
Salario Mensual en euros
de la Empresa
(500-1000] 150
(1000-1500] 50
(1500-2000] 35
(2000-2500] 165
LAS MEDIDAS DE POSICIÓN EN DISTRIBUCIONES UNIDIMENSIONALES 85
(a) El coeficiente de Gini aumenta después del despido de los 160 empleados
(b) La distribución de salarios es menos concentrada o más equitativamente
distribuida después del despido de los 160 empleados
(c) El coeficiente de Gini después del despido de los 160 empleados es
aproximadamente 0,63
(d) Las opciones (b) y (c) son correctas
!Marca Nº
Nº de acumulado Total de
de
clase
empleados de salarios p, = ¿ x1 n, p, = ~ 100 Q, =~ 100
fi n
p¡ - q¡
n, empleados ni' x,
x,
N,
L (P,- q,)
1-1
N = 400 Pn = 607.500 l= I
=
= 60,04
146,25
n-1
L CP1- q¡)
I G -_ --'--'--
l= I
n-- 1 - -
60,04 ::::: o 41
146,25 '
L P;
i=I
86 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
Nº
Marca
Nº de acumulado Total de
de N
empleados de salarios p , = ¿ x, n, p =- 100 q =..t'_IOO p¡ - q¡
clase ' N Pn
n, empleados fl¡ X,
X,
N,
ni
2JP, - Q, )
jG = t= I n 1 50,2 1 ::::: 0.35
143 ,75
L_ p,
l=I
m3 230
gl = -3 = - ~0,67 > 0
a 343
1 ~ ~ ~ ~ 1
1 1 1 1 1 : 1
X¡ n¡ N¡ X¡* n ¡
1 3 3 3
2 7 10 14
3 1 11 3
4 1 12 4
5 8 20 40
SUMA= 20 SUMA= 64
El rango se define como la diferencia entre el mayor (10) y el menor valor (1)
de la distribución. Es decir, Rx = Xn-X 1 = 5 -1 = 4
l=-fl
¿ x,
La media se define mediante la expresión siguiente: x= -'-N1
- =
64
20
=12
nota o 1 2 3 4 5 6 7 8 9 10
alumnos 1 3 o 6 4 11 2 8 7 5 3
2.
X¡ n¡ N¡ X¡* n¡ X¡ n¡
o 1 1 o o
1 3 4 3 3
2 o 4 o o
3 6 10 18 54
4 4 14 16 64
5 11 25 55 275
6 2 27 12 72
7 8 35 56 392
8 7 42 56 448
9 5 47 45 405
10 3 50 30 300
Suma =:50 Suma= 291 Suma =:2013
r-n
- ¿ x, 291
La media se define como X = - 1 -1 - =- = 5,82
N 50
2
~~
3 2
El valor de la desviación típica es : a x= -5,8 2 :::::: 2,52 74
ax 2,52 74 O
El coeficiente de variación es: Cv =-=- = ? :::::: ,43 4 3
X 5,8_
Justificación: Las opciones (a), (c) y (d) son falsas porque la variable
nacionalidad es una variable cualitativa y edad es una variable cuantitativa.
Justificación: Las opciones (a), (b) y (c) son falsas porque las dos variables
son cualitativas y a su tabla de frecuencias se les denomina tabla de
Contingencia, no tabla de Correlación.
150
'IJO
50
O l---l';:m._....L...,r-->'!.,_...J.......,.-""'.3...._J.......,-__..,11::='--.-~"---'-,-..--'---1.~.a3----'----,
e o
.e:: 8 8 .!9
8 8 ]§
~ .~
(J
o <Z.>
.e::
/g i!! ~ E
oE::
11) 11)
"' .g (J f}
'6
~
·~
fE
"' • varan
/J. o rrujer
Justificación: La opción (c) es falsa porque los tres tipos de dependencia que
refleja la teoría de la Correlación son Independencia funcional, Dependencia
funcional y Dependencia aleatoria .
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN 93
(a) Todos los modelos econométricos incluyen una variable adicional, que
trata de recoger el efecto conjunto de múltiples variables irrelevantes o
escasamente releva ntes y que se denomina "perturbación aleatoria"
(b) Los modelos que incluyen una perturbación aleatoria" se denominan
estocásticos
(c) El principal objetivo de las relaciones entre las variables es la explicación y
en su caso la predicción de una variable, que llamaremos variable
independiente, con otra u otras variables, las variables dependientes
(d) Al estudiar una relación entre variables, es importante la especificación
previa de un modelo teórico que recoja las principales relaciones de
causalidad
(a) Cuando rxy =O no existe ninguna relación cuadrática entre las variables
(b) Cuando rxy =O no existe ninguna relación de tipo lineal entre las variables
=
(c) Si r xy 1 la relación es positiva o directa
( d) El coeficiente de correlación toma valores entre - 1 y 1 ambos inclusive
Justificación: Las opciones (a) y (c) son falsas debido a que el coeficiente de
correlación es igual a -0,949, al ser el coeficiente de correlación igual a la raíz
cuadrada del coeficiente de determinación y ser negativo porque la covarianza
es negativa. La opción (b) es fa lsa porque el coeficiente de determ inación R2
indica que la recta de regresión es representativa al ser mayor de 0,85.
T.5.9. En el caso de que exista una relación lineal perfecta entre dos
variables, se cumple que:
Justificación: Las opciones (a) y (c) son falsas porque cuando existe una
relación lineal perfecta entre dos variables, el coeficiente de correlación toma
los valores 1 o -1 y la covarianza y el coeficiente de determinación no pueden
ser cero. La opción (d) es falsa porque la opción (b) es verdadera.
Justificación: Las opciones (a) y (b) son falsas porque si las variables son
cualitativas no tiene sentido ca lcular el coeficiente de correlación lineal de
Pearson ni aplicar el método de mínimos cuadrados. La opción (d) es falsa
porque la opción (c) es verdadera .
(a) [-1, 1]
(b) [0,1]
(c) [-1,1)
(d) (-1, 1)
Justificación: Las opciones (b), (c) y (d) son falsas porque el coeficiente de
correlación lineal toma valores entre -1 y 1, ambos inclusive.
96 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
Justificación: Las opciones (b), (c) y (d) son falsas porque en la regresión
lineal simple Y/ X, el coeficiente de regresión b indica la variación que se
produce en Y ante una variación de X en una unidad.
DISTRIBUCION ES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN 97
Justíficacíón: Las opciones (a), (b) y (d) son falsas porque si la varianza
residual es O, la varianza de la variable dependiente es igual a la varianza
explicada por la regresión.
Justificación: Las opciones (a ), (b) y (d.) son falsas porque la covarianza solo
viene afectada por los cambios de origen, pero no por los cambios de escala.
98 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
(a) Una medida adimensional del grado de relación cuadrática entre dos
variables estadísticas.
(b) El momento centrado en las medias m 11 de orden l.
(c) Igual a cero cuando no existe relación alguna entre las variables.
(d) Ninguna de las anteriores es verdadera
Solución: La opción (b ).
' 52 52 '
R - = J - _e2 ::::::> Ü 9 = 1- _ e ::::::> 5- = 85
5 ,. ' 850 e
(a) La Odds Ratio es una medida de asociación y su valor no puede ser menor
que cero al ser un cociente de probabilidades
(b) El coeficiente de contingencia C es una medida del grado de asociación
entre dos variables cuantitativas
(c) El estadístico x2 toma valores mayores o iguales a cero
(d) Las tablas de contingencia se utilizan para estudiar la asociación entre
variables cualitativas
Solución: La opción (b ).
Justificación: Las opciones (a) y (c) son falsas porque no tiene sentido aplicar
la técnica de regresión si las variables no muestran causalidad entre sí. La
opción (d) es falsa porque la opción (b) es verdadera.
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
101
5.2. Problemas
~ Y; 42
ªº· = -6- = -6= 7
6
¿1,
_..!=!...___ 1260_2 10
ª 02 - 6 - 6 -
6
L X;Y; 800
ª••= i=•
6
= - :::: 133,333
6
m11 = a 11 - a 10a 01 = 133,333-6-7:::::9 1,333
6 6 6 6 6
¿ x, = 36 ¿ y,= 42 ¿ x,y1 =800 ¿ x¡ = 1206 ¿ y¡= 1260
i=I i=I i=I i=I i=I
6 6
¿ x, LY; 42
36
a,o= --
6
=-=
i=I
6
6 ªº' =.E..!__=
6
-6 = 7
6
¿ y¡
_ k!...__ - 1260 - 2 1o
ª 02 - 6 - 6 -
6
~ X¡J, 800
a,1 = - - = - "'133,333 m11 = a11 - a10 a01 = 133,333-6 · 7 ""9 1,333
6 6
a~0 = 2 01 - 6 = 165
2
m20 = a20 - m02 = a02 - a~, = 21O-7 2 = 161
S~ a~ 1
2
= a02 - = 2 1O- 7 = 161
La expresión de la varianza explicada por la regresión es:
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
103
52 = m0
m2 = 16 i X 9 1333
_ ll '
2
::::; J J Ü44
1
ry - m 20 165 ,
6 6 6 6 6
_L x;=36 _L y1 =42 _Lx;Y1 =800 _L i,1= 12 06 _L .0= 1260
i= I i= I i=I i= I
¿ x; LY; 42
;.¡ 36 6 ª 01 =...!::!....___=-= 7
ª1 0= - - = - =
6 6 6 6
6
¿ ¡,
-~- 1 260_210
ª
02 - 6 - 6 -
6
f;x,y, 800 ,
a 11 =- - =- "' 133,333 m11 =a11 - a10 a01 = 133,333- 6 · 7 "'91,33_,
6 6
2
m20 = a 20 - a;0 = 20 1-6 2 = 165 m02 = a02 - a¿1 =2 10-7 =16 1
~d
s
m
1 2 3 4 5 Total
e ( )
500-1.000 8 6 14 6 4 38
1. 000-1. 500 3 6 2 11 5 27
1.500-2.000 4 2 8 2 7 23
2.000-2.500 o o 2 4 6 12
Total 15 14 26 23 22 100
2
(L¡. 1,L¡] (n¡) m¡ =X¡ (n¡)*X¡ X, - X (X; - X)2 (X; - X) n,
500-1.000 38 750 28.500 -545 297.025 11286.950
1.000- -45 2.025 54.675
27 1.250 33.750
1.500
1.500- 207.025 4761.575
23 1.750 40.250 455
2.000
2.000- 912.025 10.944.300
12 2.250 27.000 955
2.500
Total 100 129.500 27.047.500
100 -
1
¿ (x, - X) n,
(J' 1 = 1-1 = 27047500 = 270475
X N 100
Años -
(n¡) m¡ = Z¡ (n¡)*Z¡ z,- z (z, - z)1 (Z1 - Z) 1 n,
Antigüedad
1 15 1 15 -2,23 4,97 74,59
2 14 2 28 -1,23 1,51 21 ,18
3 26 3 78 -0,23 0,05 1,38
4 23 4 92 0,77 0,59 13,64
5 22 5 110 1,77 3,13 68,92
Total 100 323 179,71
100
_ ¿z¡n¡
Z= i=I =3 23= 323
N 100 '
Años de antigüedad
Salarios 1 2 3 4 5 Total
mensuales en
euros(€)
500-1.000 8 6 14 6 4 38
1.000-1.500 3 6 2 11 5 27
1.500-2.000 4 2 8 2 7 23
2.000-2.500 o o 2 4 6 12
Total 15 14 26 23 22 100
-
(L¡. 1,L¡] (n¡) m¡ =X¡ (n¡)* X¡ X, - X
500-1.000 38 750 28.500 -545
1.000-1.500 27 1.250 33.750 -45
1.500-2.000 23 1.750 40.250 455
2.000-2.500 12 2.250 27.000 955
Total 100 129.500
Años -
(ní) m¡ = Z¡ (ni)* zi z,- z
Antigüedad
1 15 1 15 -2,23
2 14 2 28 -1,23
3 26 3 78 -0,23
4 23 4 92 0,77
5 22 5 110 1,77
Total 100 323
Con estos datos se puede formar la siguiente tabla auxiliar, que nos permite
obtener los resultados buscados.
108 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
- -
X,- X zk - z nik (X,- X) (z, - Z)n,1
Para (x = 750; z = 1) -545 -2,23 8 9722,8
Para (x = 750; z = 2) -545 -1 ,23 6 4022,1
Para (x = 750; z = 3) -545 -0,23 14 1754,9
Para (x = 750; z = 4) -545 0,77 6 -2517,9
Para (x = 750; z = 5) -545 1,77 4 -3858,6
Para (x = 1.250; z = 1) -45 -2,23 3 301,05
Para (x = 1.250; z = 2) -45 -1,23 6 332,1
Para (x = 1.250; z = 3) -45 -0,23 2 20,7
Para (x = 1.250; z = 4) -45 0,77 11 -381, 15
Para (x = 1.250; z = 5) -45 1,77 5 -398,25
Para (x = 1.750; z = 1) 455 -2,23 4 -4058,6
Para (x = 1.750; z = 2) 455 -1,23 2 -1119,3
Para (x = 1.750; z = 3) 455 -0,23 8 -837,2
Para (x = 1.750; z = 4) 455 0,77 2 700,7
Para (x = 1.750; z = 5) 455 1,77 7 5637,45
Para (x = 1.750; z = 1) 955 -2,23 o o
Para (x = 2.250; z = 2) 955 -1,23 o o
Para (x = 2.250; z = 3) 955 -0,23 2 -439,3
Para (x = 2.250; z = 4) 955 0,77 4 2941,4
Para (x = 2.250; z = 5) 955 1,77 6 10142,1
Total / Suma 21965
Co 1f x z) =
f :tn,lx; - xXzk- z)= -
1 1
~ k- i
2 1965
- = 219 65
V\ ' N 100 '
Este valor significa que existe una relación positiva entre los salarios (X) y los
años de antigüedad (Z), indicándonos que, estadísticamente, a medida que
aumenta la antigüedad de los trabajadores aumenta su sa lario.
1 X¡ y¡ X¡ y¡ X¡2 y¡2
1 5 20 100 25 400
1 6 25 150 36 625
1 7 29 203 49 841
8 33 264 64 1089
Suma= 26 Suma= 107 Suma = 717 Suma = 174 Suma = 2955
a= a 01
- ba 10
::::; -1 ,2
110 EJERCIC IOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE
Período X¡ y¡
Semana 1 32 200
Semana 2 25 420
Semana 3 23 380
Semana 4 21 300
Semana 5 18 170
X¡ y¡ x2 y2 X.y
32 200 1024 40.000 6.400
25 420 625 176.400 10.500
23 380 529 144.400 8.740
21 300 441 90.000 6.300
18 170 324 28.900 3.060
Suma= 119 Suma =1.470 Suma = 2.943 Suma = 479.700 Suma = 35.000
X= a10 =23,8
a= a0 1 - ba,0 = 290,99
X: Nº de horas o 1 2 3 5
Y: Nº de bacterias 12 24 35 66 14
(a) La media del número de horas es 2,5 y la media del número de bacterias
es 33
(b) El valor de la covarianza es menor de 5
(c) La recta ajustada y/x es representativa ya que el coeficiente de
determinación correspondiente (R2) es cercano a 1
(d) Ninguna de las respuestas es verdadera
X¡ y¡ x2 y2 x.y
o 12 o 144 o
1 24 1 576 24
2 35 4 1.225 70
3 66 9 4.356 198
5 14 25 196 70
11 151 39, 6.497 362
X: Nº de horas o 1 2 3 5
Y: Nº de bacterias 12 24 35 66 14
a = ª 0 1 - ba10 ~ 25,77
X y
8 41,85
9 43,86
10 45,87
11 47,88
12 49,89
Variable X Variable Y
20 200
25 420
24 380
21 300
18 170
X¡ y¡ X¡2 X¡ y¡ y¡2
20 200 400 4000 40000
25 420 625 10500 176400
24 380 576 9120 144400
21 300 441 6300 90000
18 170 324 3060 28900
1 Suma Total 108 1.470 2366 32980 479700
Variable X ¿ x,
a = ...!::.!___
10 5
108
= - = 21 ,60 = X
5
a20 = ~x,'
5
= 2·366 = 473 ,2 0
5
5 5
Variable Y LY1
a = -='-----
1.470
= -5- = 294 = y a ,= ~~ = 479.700 = 95.940
01 5 º- 5 5
Momento ~ 5
Producto
3 =
I I X,Y ¡ 32 980
= - ·- = 6.596
respecto al 11
/• I l=I
5 5
origen
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
115
Variable X
s,; = m20 = a 20 -
, ,
a¡0 = 4 73,20-21.60' = 6,64
Variable Y 52
y= mo2 =ª02- ª 012 =95 .940-2942 = 9.5o4
Momento Producto
respecto a la Sxy = m11 = a11 - a10 a01 = 6.596- 2 1,60· 294= 245 ,60
media
X¡ y¡ X¡2 X¡ y¡ y¡2
10 130 100 1300 16900
25 155 625 3875 24025
40 175 1600 7000 30625
so 210 2500 10500 44100
1 Suma Total 125 670 4825 22675 115650
ª 10 31,2500
ª 01 167,5000
ª 20 1206,2500
ª 02 28912,5000
ª 11 5668,7500
m11 = a11 - a1oao1 434,3750
m20 = a20 - a10a10 229,6875
mo2 = ao2 - ao1ao1 856,2500
b = mu/m20 = 1,891156
a = ao1 - b*a 10 = 108,401361
X y
19 120
20 116
30 110
33 101
38 100
X¡ y¡ X¡2 X¡ y¡ y¡2
19 120 361 2280 14400
20 116 400 2320 13456
30 110 900 3300 12100
33 101 1089 3333 10201
38 100 1444 3800 10000
1 Suma Total 140 547 4194 15033 60157
ª 10 28
ª 01 109,4
ª 20 838,8
ª 02 12031,4
au 3006,6
mu = au - a1oao1 -56,6
m2o = a20 - a10a10 54,8
mo2 = ao2 - ao1ao1 63,04
b = mll/m 02 = -0,897843
a = a10 - b* a01 = 126,223985
a10 9
ao1 4,470001
ª 20 91,8
ao2 19,996107
ª 11 40,620912
mu = au - a1oao1 0,390907
m2o = a20 - a1oa10 10,8
mo2 = ao2 - ao1ao1 0,015201
B = mu /m20 = 0,036195
A = ao1 - b* a 10 = 4,144245
X¡ = X¡ y¡ X; = In x; Y¡ = In y¡ x? X; Y; Y;2
4 70 1,386294 4,248495 1,921812 5,889665 18,049712
7 85 1,945910 4,442651 3,786566 8,645000 19,737150
9 90 2,197225 4,499810 4,827796 9,887092 20,248287
12 95 2,484907 4,553877 6,174761 11,315959 20,737795
13 100 2,564949 4,605170 6,578965 11,812028 21,207592
Suma
41 440 10,579285 22,350003 23,289900 47, 549745 99,980536
1
Total
122 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
a 10 2,115857
ao1 4,470001
a20 4,657980
ª 02 19,996107
au 9,509949
mu = au - a10ao1 0,052067
m20 = a20 - a10a10 0,181129
mo2 = ao2 - ao1ao1 0,015201
B = m11/m 20 = 0,287456
A= ao1 - b* a10 = 3,861784
Siendo:
• r el número de filas
• k el número de columnas
• Oij (frecuencia observada) el número de casos observados clasificados
en la fila i de la columna j
• Eij (frecuencia esperada) el número de casos esperados, en el supuesto
de independencia, correspondientes a la fila i de la columna j
_01.U. 1 _ 12•30 _
E11 9
º·· 40
- ----
El, º1·º·2 12 * 1o = 3
= =
- º- 40
_u .u. _28 •3o _ 21
E º- - 40 -
21 -
2 1
x- L,L, 1
, = ~~ (0, - E,J1 =
(10 - 9}2 (2 - 3)2 (20 - 21 )2 (8-7)2
+--+ + -- :::;0635
' l• l /=1 E,¡ 9 3 21 7 '
124 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
Siendo:
DISTRIBUCIONES BIDIMENSIONALES. REGRESIÓN Y CORRELACIÓN
125
C=g; ~ 001 1
1
x-> + n '
Yi X¡
30 200
40 258
78 244
68 231
88 209
22 215
10 113
¿ x,
a10 = -X=/;-¡ - =14-70= 2 10
N 7
f;7
-
L Y1
¡;¡ 336 48
ª º'= Y=---¡¡--- =- 7- =
Yi X¡
30 200
40 258
78 244
68 231
88 209
22 215
10 113
(a) Una referencia que nos sirve para encontrar una estadística
(b) Una medida estadística que tiene utilidad para efectuar comparaciones en
diferentes momentos o periodos, respecto de una variable
(c) Una medida estadística que relaciona dos o más variables y que resulta de
gran interés para la predicción del comportamiento futuro de las mismas y
del grado de asociación y correlación entre ellas.
(d) Las opciones (b) y (c) son ciertas
Solución: La opción (b ).
Justificación: Las opciones (a) y (c) son falsas porque un Número Índice es
una medida estadística diseñada para poner de manifiesto los cambios en una
variable (o grupo de variables relacionadas) con respecto a una determinada
característica (generalmente, el tiempo). Se utilizan para efectuar
comparaciones en diferentes momentos o periodos, respecto de una variable.
La opción ( d) es falsa porque la opción ( c) es falsa .
Solución: La opción (b ).
132 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE
Años Precio
2010 95
2011 100
2012 115
Justificación: Las opciones (a) y (b) son falsas porque los valores de los
números índice de los precios en 2010 y 2012 son respectivamente 95 y 115
que coinciden con los valores de los precios, debido a que el precio del año
base 2011 es precisamente 100. La opción (d) es falsa porque la opción (b) es
verdadera. Para calcular los números índice simples hay que tener en cuenta
que se obtienen a partir de la razón de precios (precios relativos) respecto a
su valor en el período base y expresados en forma de porcentaje:
12º"= ~º'" • 1 00 = ~• 1 00 = 11 5
-º" P..:!tlll 100
(a) La variación porcentual de los precios entre los años 2010 y 2011 es 0,5%
(b) la variación porcentual de los precios entre los años 2010 y 2012 es 3,9%
(c) La variación porcentual de los precios entre los años 2010 y 2011 es -0,5%
(d) Ninguna de las opciones es verdadera
Justificación: Las opciones (a) y (b) son falsas porque para calcular la
variación porcentual de los precios, al índice correspondiente a cada año con
base 2010, se le debe restar el valor de 100. Por tanto, la variación porcentual
de los precios entre los años 2010 y 2011 es -0,5% y la variación porcentual
de los precios entre los años 2010 y 2012 es 3,4%. La opción (d) es falsa
porque la opción (c) es verdadera.
(a) 160
(b) 165
(c) 260
(d) 166,7
Solución: La opción (b ).
(a) Los índices complejos son aquellos que poseen una raíz compleja
(b) La magnitud de un índice complejo no puede ser menor de 100
( c) El índice media agregativa ponderada de índices simples es un número
N
, :¿ x,,w,
Indice complejo y se define: / -- ...!=l_
N
. 100 , siendo w, las ponderaciones
¿ x'° w,
1-J
(a) Para calcu lar el Índice de Fisher basta con conocer los Índices de
Laspeyres y Paasche
(b) Para calcular el Índice de precios de Laspeyres es necesario conocer los
consumos de cada año
(c) El índice de Fisher es la media geométrica de los Índices de Laspeyres y
Paasche
(d) El Índice de precios de Fisher no puede ser igual a cero
(a) Para calcular el Í ndice de Paasche es suficiente con conocer los Índices de
Laspeyres y Fisher
(b) El índice de precios de Laspeyres utiliza como coeficientes de ponderación
el valor de las transacciones en el periodo base (p¡0q,0)
(c) Para calcular el Índice de Laspeyres necesitamos conocer solamente los
precios del año base
(d) El cuadrado del Índice de Fisher es igual al producto de los Índices de
Laspeyres y Paasche
(a) Pit·q¡o
(b) p¡o·q¡o
(c) p¡o·q¡t
(d) Ninguna de las respuestas es correcta
(a) Para pasar de una serie en moneda corriente a otra en moneda constante
se procede multiplicando la primera por un índice de precios adecuado
(b) La propiedad de Existencia de un número índice consiste en que todo
número índice ha de tener un valor finito distinto de cero e inferior a 100
( c) El Índice de Fisher es la media aritmética de los Índices de Laspeyres y
Paasche
(d) Ninguna de las respuestas es verdadera
Justificación: La opción (a) es falsa porque para pasar de una serie en moneda
corriente a otra en moneda consta nte se procede dividiendo la primera por un
índice de precios adecuado. La opción (b) es falsa porque la propiedad de
Existencia de un número índice consiste en que todo número índice ha de
tener un valor finito distinto de cero. La opción ( c) es falsa porque el Índ ice de
Fisher es la media geométrica de los Índices de Laspeyres y Paasche .
...
SERIES TEMPORALES 141
T.6.30. En relación con los números índ ices, indique cuál de las
siguientes opciones es falsa.
¿ x,1w,
Índice complejo y se define: I = 'N 1 . 1oo, siendo w, las ponderaciones
¿x,o w,
1 1
(b) Un número índice es una medida estadística que relaciona dos o más
variables y que resulta de gran interés para la predicción del
comportamiento futuro de las mismas y del grado de asociación y
correlación entre ellas
(c) El Índice de precios de Fisher para el año base es igual a 100
(d) El cuadrado del Índice de Fisher es igual al producto de los Índices de
Laspeyres y Paasche
6.2. Problemas
Años Precio
2009 183
2010 196
2011 191
2012 196
(a) El número índice de los precios en 2010 con base en 2010 es 100
(b) Los precios se han reducido en 2011 respecto a 2010 en aproximadamente
el 2,55%
(c) El número índice de los precios en 2012 con base en 2010 es 100
(d) El número índice de los precios en 2012 con base en 2010 es
aproximadamente 102,53
Cálculo: Para ca lcular los números índice y las variaciones porcentuales de los
precios hay que tener en cuenta que los números índices se obtienen a partir
de la razón de precios (precios relativos) respecto a su valor en el período
base:
/~ = P¡ * 100
Po
Asimismo, las variaciones o incrementos porcentuales de los precios entre el
año t y el t+ 1, se calculan comparando los números índice o las magnitudes
de los precios mediante la expresión siguiente:
I
Y,l• = ll ;,I )X] j- 00 100
VPJ~'1';=(( P,•., x100J- 100 =((.!2.!.)x 100)- 100 = !J,º: - t;;:,'i=97A5- 100" -2.55°o
l P,OlU/ 196
SERIES TEMPORALES 145
Justificación: A continuación se comprueba que las opciones (a), (c); y (d) son
falsas y se indican las soluciones verdaderas.
Cálculo: La opción (a) es falsa ya que la nota media de los alumnos aprobados
en Septiembre de 2009 en estos cent ros es aproximadamente 5,575. En
relación con la opción (b), en la tabla adjunta se muestran las magnitudes de
los índices de cada centro, tomando como base a junio de 2010. Para calcular
los números índice hay que tener en cuenta que se obtienen a partir de la
146 EJERCICI OS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE
!MAOR/Osep-li
¡un-10
= 5•,8·100 => IMAOR/0 ¡un
5
CP
11
::::
111 -
109' 434
53
Finalmente, dicha tabla nos permite la comprobación de que las opciones (c) y
(d) son falsas ya que el mayor descenso de notas entre ambos períodos Uunio
de 2010 y Septiembre de 2012), que se obtiene como la diferencia entre los
índices correspondientes a las respectivas fechas, no corresponde a Córdoba
sino a Palencia. Asimismo, el mayor aumento de notas entre junio y
septiembre de 2010 no corresponde a Sevilla sino a Madrid.
Cálculo:
Para calcular los precios a partir de los números índice hay que tener en
cuenta que los precios se obtienen a partir de la razón de los números índice,
análogamente a como se ha realizado para el cálculo de los números índice,
basándose en el mantenimiento de las razones, es decir en una simple regla
de tres. La fórmula para obtener el precio del año 2012, a partir del precio en
2011 que es 200, es la siguiente:
/"º12 132
= P (en 20 11 ) ;~ ~ = 200* - = 220
1;011 0
1
P (en 20 12)
120
J- l00:::::: 2Qo/c
l
¡ 2011
v:20 11 = 20 1o x lOO
2010 ¡ 2010 o
2010
2012
V.2010 =
¡ 20 12
~
J
X 100 -100:::::: 32o/co
¡ 20 10
(
2010
decir, como el índice en base 2010 para el año 2010 es 100, habría que restar
100 al índice del año en base 2010 para obtener la variación porcentual entre
el año base y el año en cuestión. No debe olvidarse que este método solo se
puede aplicar cuando calculemos la variación porcentual de los precios entre el
año base y ot ro año. En nuestro caso:
P.6.4. Con los siguientes datos, elaborar un Índice de los precios con
base el año 2007 = 100 e indicar cuál de las siguientes afirmaciones
es falsa .
Años Precio
2007 150
2008 158
2009 168
2010 175
2011 183
2012 196
Cálculo: Para calcular los números índice y las variaciones porcentua les de los
precios hay que tener en cuenta que los números índices se obtienen a partir
de la razón de precios (precios relativos) respecto a su valor en el período
base:
SERIES TEMPORALES 149
Por ejemplo, en el caso del año 2010 y tomando el año 2007 como base:
1/201 1 -
V2007 -
¡ 20 1 1
2007 -
¡ 2007 -
2007 -
122 - 100 -- 2201
/O
Años Va lor
2008 10 1
2009 14
2010 20
2011 25
2012 30
(a) El índice para 2011 con base 100 en 2008 es de 200 y el año con mayor
incremento relativo en relación con el año anterior es 2010
(b) El índice para 2011 con base 100 en 2008 es 250 y el incremento de 2009
sobre el 2008 del 40%
(c) El índice para 2010 con base 100 en 2008 es 200 y el incremento de valor
en todo el período analizado 2008-2012 es del 200%
(d) Ninguna de las respuestas es verdadera
Para calcular los números índice y las variaciones porcentuales de los precios
hay que tener en cuenta que los números índices se obtienen a partir de la
razón de precios (precios relativos) respecto a su va lor en el período base:
/~ = P, * 100
?¡,
Por ejemplo, en el caso del año 2011 y con base 100 en 2008:
1;~~! = ~Ol I • 25
100 = • 100"" 250
- ~008 1o
Asimismo, las variaciones o incrementos porcentuales de los precios entre el
año t y el t+ 1, se calculan compara ndo los números índice o las magnitudes
de los precios mediante la expresión siguiente:
J
10 12
l/.2008
l
= ¡'O P X J00 - 100 ~ 20Qo/c
2 00S
¡ 2008
2008
o
2010 2012
Ventas Ventas
Precio Precio
(miles de euros) (miles de euros)
Empresa 1 610 85 690 94
Empresa 2 770 80 795 100
Empresa 3 630 96 650 115
(a) Los índices de Paasche y Laspeyres, con base en el año 2010, son,
respectivamente 105,958 y 106,133 aproximadamente
(b) Los índices de Paasche, Laspeyres y Fisher, con base en el año 2010 son,
respectivamente 105,121, 105,312 y 105,223 aproximadamente
(c) El índice de Fischer, con base en el año 2010, es 105,567
aproximadamente
(d) Ninguna de las opciones es cierta
1
SERIES TEMPORALES 153
i
Empresas P¡(l2) • Q¡(lO) P¡(lO) • Q¡(lO)
1
1 58.650 51.850
2 63.600 61.600
3 62.400 60.480
Total de sumas 184.650 173.930
La fórmula empleada es : FP = ~ Lp · PP
2010 2012
Consumo en Consumo en
Precio Precio
miles de euros miles de euros
Producto A 630 84 660 98
Producto B 870 78 750 120
Producto C 720 94 640 138
(c) Para los dos años 2012 y 2010 no se verifica la propiedad de la inversión
temporal para el índice de Fisher
(d) Las dos primeras opciones son verdaderas
Solución: La opción (c).
Para demostrarlo basta con calcular los valores de dicho índice a partir de los
índices de Laspeyres y Paasche, correspondientes a los años base 2010 y
2012, y comprobar que cumple dicha propiedad.
Cálculo:
Productos P;(lO) · Q;( lO) P;( l2) · Q;(lO) P;(lO) · Q;(l2) P;( l2) · Q;(l2)
Producto A 52.920 55.440 61.740 64.680
Producto B 67.860 58.500 104.400 90.000
Producto C 67.680 60.160 99.360 88.320
Total de sumas 188.460 174.100 265.500 243.000
SERIES TEMPORALES 155
174
!PL' 2 = · 1OO·I00 => IPL' 2 = 92 380
'º 188.460 IO '
En nuestro caso,
188 6
!PP.,º= .4 0. 100 => !PP 1 = 108 248
I_ 174.100 IO '
156 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
La fórmula empleada es : FP = ~
En nuestro caso,
Propiedad de inversión:
(d) es falsa.
Cálculo:
Producto P¡(lO)· P¡( 10)· P¡(lO) · P¡(l l)· P1(1l)· P1(12)· P1(12) ·
Q;( lO) Q;(ll) Q;(12) Q;( lO) Q;( ll) Q¡( lO) Q;(12)
A 175.000 213.500 231.000 185.000 225 .700 250.000 330.000
B 120.000 88.000 92.000 135.000 99.000 141.000 108.100
e 75.000 70.000 80.000 82 .500 77.000 87.000 92.800
D 65 .000 58.500 71.500 68.000 61.200 70.000 77.000
Total
370.000 37 1.500 403.000 402.500 401.700 478.000 530.900
Suma
4 25
!PL1110 = º
· 00 · I 00 => IPL11 = 108 784
370.000 IO '
4
!PP: ' = 0l.700· 100 => IPP ' = 108.129
IO 37 1.500 IO
158 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTI CA DE ADE
Cálculo:
!PL1211 = ·º º
247 2
240.700
-100 => IPL1211 :::: 102 626
,
155 840
!PP.112 = - -100 ::::> !PP.112 :::; 102 933
151.400 ,
En nuestro caso,
En nuestro caso,
IPE111~= 4 º
2 86
· º· 100::::102.744
392. 100
Cálculo:
85 713 6
!PL12
11 = · · ·100 => !PL12
11
.:::: 166.9 1O
51.353, 1
En nuestro caso,
2011 2012
Empresas Ingreso Ingreso
Cantidad Cantidad
promedio promedio
A 118 160 185 150
B 145 215 222 227
c 75 80 126 310
Cálculo: Las magnitudes de los sumatorios necesarios para calcular los índices
se muestran en la sig uiente tabla.
1 73 865 12
IPL ; = · · 100 :::::> IPL11 = 63 0226
l. 117.204 ,
IPP. 2 =
JI
11 7 2 4
·
73.865
º· 100 :::::> IPP. 2 = 158 6733
JI '
1 56 055 1
/PP., = ·
)_ 87.4 10
. 100 :::::> / PP., = 64 1288
)_ ,
1' ¡ 11
1 .----12_ = 1
_1_1
100 100
Caso del índice de Laspeyres. 155,9361 x 63,0226 "" 0,9827 que es distinto de
1, luego no cumple la propiedad de inversión.
Caso del índice de Paasche: 158,6733 x 64,1288 "" 1,0176 que es distinto de 1,
luego no cumple la propiedad de inversión.
En nuestro caso, con el año 2011 como base, el incremento del Índice de
precios de Paasche en 2012 respecto 2011 es:
11201
V201 12-- /D201
í 201 12- ¡2011
2011-- 15 8,6 733 - I00 -- 58,67oYo
Índice base
AÑO
2006
2006 100
2007 110
2008 114
2009 110
2010 120
2011 130
l
~~¡ = ~~~~6 X 1ooJ - 100; Por ejemplo para el año 2009 respecto a 2008:
l/
2006
ºº = ¡ ;gg:
v:2008 x 1ooJ- 1oo = (J_!Q x i oo) - 1oo ~ - 3 si %
2 9
2008 114 ,
2006
166 EJERC ICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
Índices
Años
con base 2008
2008 100
2009 120
2010 132
2011 143
2012 154
l
~~1 = 1~~~ 8 x 100J- 1 00; Por ejemplo para el año 2011 respecto a 2009:
1
2008
.2º11 =
l!'2009 [ 1~g~~ x1ooJ-1 oo = ( 143
¡2009 120 x1oo)- 1oo¡:::19' 17%
2008
Año Ventas
2009 430
2010 410
2011 380
2012 400
Ventas Deflactadas
Año Ventas Deflactor
(Ventas / deflactor)
2009 430 1 430
2010 410 1,035 396,135
2011 380 1,071 354,734
2012 400 1, 109 360,777
168 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
Cálculo:
Justificación: La opción (c) es falsa porque respecto a los ajustes por mínimos
cuadrados, las funciones de tendencia más utilizadas son: lineal, polinómica y
exponencia 1.
Justificación: La opción (a) es falsa porque las ventajas que tiene la media
móvil son la flexibilidad y la facilidad de cálculo. Los principales inconvenientes
son: a) La pérdida de información; de la tendencia en los ejercicios inicial y
final (en el caso de media móvil con periodicidad de tres términos se han
perdido dos datos, el primero y el último, pero en el caso de medias móviles
con mayor periodicidad perderíamos más información); b) La decisión, que es
relativamente arbitraria, del número de periodos utilizados para calcularla y la
variabilidad que ello conlleva, ya que los datos obtenidos con una media móvil
de 3 períodos son bastante diferentes de la media para la misma serie pero
con 5 períodos de cálculo.
(a) Los métodos clásicos de análisis de la tendencia son los semipromed ios,
los ajustes de una función por mínimos cuadrados y el método de los
promedios (o medias) móviles.
(b) Los métodos habituales de análisis de las variaciones estacionales son los
semipromedios, los ajustes de una función por míni mos cuadrados y el
método de los promedios (o medias) móviles.
(c) Los suavizados exponenciales son métodos dirigidos a eliminar los ciclos y
las variaciones estacionales de las series.
(d) Ninguna de las anteriores opciones es verdadera
Justificación: Las opciones (a) y (b) son falsas porque al utiliza rse medias
móviles, se produce una pérdida de información correspondiente al número de
periodos por año considerados, en nuestro caso, seis en el inicio de la serie y
seis en el final, es decir, el número de medias móviles centradas obtenidas
será 36. La opción (d) es falsa porque la opción (a) es falsa.
T.7.9. Dada una serie cuyo periodo es de dos años, indique cuál de
las siguientes opciones es verdadera.
(a) Las variaciones cíclicas e irregulares de una serie son las que tienen una
periodicidad menor de un año
(b) En teoría, cabe entender una serie temporal como una suma de un
número indeterminado de ciclos de amplitud y período diferentes, y puede
demostrarse que la varianza que muestra en el tiempo una serie temporal
se obtiene a partir de la suma de las amplitudes de los diferentes ciclos en
que se descompone la serie temporal
(c) Las variaciones cíclicas e irregulares de una serie recogen ciclos que tienen
un solo componente básico: la amplitud o la distancia que media entre el
cero y el máximo valor que alcanza el ciclo
(d) Ninguna de las opciones planteadas es cierta
(a) Calcula la tendencia mediante la recta que une las dos medias (o
semipromedios) de las dos mitades en que se divide la serie de datos
(b) Es una buena técnica para eliminar el componente cíclico de una serie
(c) Calcula la tendencia sin necesidad de ajustar una función previa
(d) Ninguna de las anteriores es cierta
Justificación: Las opciones (a) y (b) son falsas porque el método de las medias
móviles es una técnica para calcular tendencias sin tener que ajustarnos a una
función previa . Una media móvil es un promedio de un número determinado
de datos, u orden de la media móvil, que se imputa siempre a la fecha central
SERIES TEMPORALES 175
Solución: La opción (b ).
(a) Aditivo
(b) Multiplicativo
(c) Tanto aditivo como multiplicativo
(d) Ninguna de las anteriores es cierta
Justificación: Las opciones (a) y (c) son falsas porque el método del
porcentaje promedio es un procedimiento para elabora r un índice estacional,
que se supone de carácter multiplicativo. La opción (d) es falsa porque la
opción (b) es verdadera.
Solución: La opción (b ).
Justificación: Las opciones (b), (c) y (d) son falsas porque el método del
suavizado exponencial simple se utiliza cuando la serie presenta un
comportamiento estacionario, es decir, no tiene tendencia.
Justificación: Las opciones (a), (c) y (d) son falsas porque el método del
suavizado exponencial de Holt se utiliza cuando la serie presenta tendencia
lineal, creciente o decreciente, y puede ser modelizada como: Xt = a + bt +
Ut; con t = 1, 2, .... , T; donde Ut sería la fluctuación irregular. Es decir no tiene
componente estacional.
178 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
Solución: La opción ( c)
Justificación: Las opciones (a), (b) y (d) son falsas porque el método del
suavizado exponencial de Winters se utiliza para modelizar series con
tendencia lineal y patrón estacional multiplicativo.
SERIES TEMPORALES 179
7. 2. Problemas
Ventas Tendencia
Año Trimestre
(Miles de Euros) (Miles de Euros
2009 1 4000 4102
2009 2 4080 4161
2009 3 4110 4220
2009 4 4500 4280
2010 1 4308 4339
2010 2 4460 4399
2010 3 4298 4458
2010 4 4720 4517
2011 1 4740 4577
2011 2 4680 4636
2011 3 4490 4696
2011 4 4920 4755
2012 1 4680 4814
2012 2 4902 4874
2012 3 4700 4933
2012 4 5166 4993
.
Pr omedto
_40_00_+_4_08_0_+_
.......
_ _..._.. +_4_29_8_+_
47_20 = 4.J'09 <
iooi;1010 = ,.,
8
.
Pr omed!O ~010-1012 =
4740 +4680 + ............. +4700 +5 166 =478475
8 ,
Xt = 4,5; Yt = 4309,5
Xt = 12,5; Yt = 4784,75
. 12+ 15 + 18 + 15
Promedio'""'
- •-00, = 4 =15
. 13 + 12 + 15+20 -
Promed10 • 00~, 111 • = = 1)
- - - 4
Xt = 2,5; Yt = 15
Xt = 6,5; Yt = 15
184 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
a= 15 - 6,5·0 = 15
Yt(Valores de la
Serie Original
Año Xt Tendencia en
(Miles de Euros)
Miles de Eu ros
2005 12 1 15
2006 15 2 15
2007 18 3 15
2008 15 4 15
2009 13 5 15
2010 12 6 15
2011 15 7 15
2012 20 8 15
Costes Tendencia
Año
(Miles de Euros (Mi les de Euros
2006 191 201,75
2007 204 204
2008 205 206,25
2009 208 208,50
2010 211 210,75
2011 213 213
2012 230 215,25
Xt = 2; Yt = 200
Xt = 6; Yt = 218
b = 21 8 - 200 = 4 50
4 '
Por tanto, se estima un incremento medio de las ventas de 4,50 miles de
euros al año. El valor de a se puede obtener considerando cualquiera de los
dos puntos; por ejemplo, considerando el primer semipromedio:
Yt (Valores de la
Serie Original Semi promedios
Año Xt Tendencia en
(M iles de Euros) (Medias)
Miles de Euros
2006 191 1 195,50
2007 204 2 200 200,00
2008 205 3 204,50
2009 208 4 209,00
2010 211 5 213,50
2011 213 6 218 218,00
2012 230 7 222,50
213- 204 .
b= = 2.25 (Mi les de Euros)
4
Por tanto, se estima un incremento anual nulo de 2,25 (Miles de Euros). El
valor de a se puede obtener considerando cualquiera de los dos puntos; por
ejemplo, considerando el primer semipromedio:
2002 936
2003 927
2004 868
2005 830
2006 783
2007 805
2008 720
2009 750
2010 701
2011 670
2012 700
- - 3 = 827
P.7.6. Con los siguientes datos sobre la evolución de los pasajeros
anuales de un aeropuerto en miles de personas, construya tres
nuevas series suavizadas a partir de un promedio móvil de 3 años,
de un promedio móvil de 5 años y de un promedio móvil de 7 años.
Indique cuál de las opciones siguientes es verdadera.
2002 157
2003 161
2004 144
2005 150
2006 140
2007 134
2008 140
2009 150
2010 161
2011 153
2012 160
SERIES TEMPORALES 193
Solución: La opción (b ).
2) Una vez obtenidos los promedios mensuales de cada año, se dividen los
viajeros de cada mes por el promedio mensual del año correspondiente,
expresándolos en forma de porcentajes, que se muestran en la siguiente
tabla. Por ejemplo, pa ra Enero de 2010 sería el cociente entre 11 y 16
expresado en tanto por ciento (68,75% ).
196 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADISTICA DE ADE
2) Una vez obtenidos los promedios mensuales de cada año, se dividen los
viajeros de cada mes por el promedio mensual del año correspondiente,
expresándolos en forma de porcentajes, que se muestran en la siguiente
tabla. Por ejemplo, para Enero de 2010 sería el cociente entre 33 y 48,
expresado en tanto por ciento (68,75%).
2) Una vez obtenidos los promedios trimestrales de cada año, se dividen los
viajeros de cada trimestre por el promedio trimestral del año
correspondiente, expresándolos en forma de porcentajes, que se muestran
en la siguiente tabla. Por ejemplo, para el primer trimestre de 2010 sería el
cociente entre 38 y 48, expresado en tanto por ciento (79,17%).
100). Por ejemplo, el primer valor del índice estacional sería 133, l 1% que
se obtiene de multiplicar por 100 al cociente entre 2.253 y 1.692,54, es
decir: (2.253/1.692,54) x 100 y correspondería al mes de Julio.
Promedio Móvil
Porcentaje sobre
Media Móvil Centrado
Año Mes Datos f-1edia Móvil (%)
12 meses (Serie
(Indice estacional)
desestacionalizada)
Enero 1.203
Febrero 1.225
Marzo 1.519
Abril 1.729
Mayo 1.779
Junio 1.935
1.694,00
Julio 2.253 1.692,54 133,11%
1.691,08
2011 Agosto 2.274 1.688,17 134,70%
1.685,25
Septiembre 2.024 1.680,88 120,41%
1.676,50
Octubre 1.820 1.671,29 108,90%
1.666,08
Noviembre 1.304 1.663,29 78,40%
1660,50
Diciembre 1.263 1659,46 76,11%
1.658,42
Enero 1.168 1.656,08 70,53%
1.653,75
Febrero 1.155 1.650,92 69,96%
1.648,08
2012 Marzo 1.414 1.645,13 85,95%
1.642,17
Abril 1.604 1.636,79 98,00%
1.631,42
Mayo 1.712 1.626,04 105,29%
206 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE A DE
1.620,67
Junio 1.910 1.615,25 118,25%
1.609,83
Julio 2.197
Agosto 2.206
Septiembre 1.953
Octubre 1.691
Noviembre 1.175
Diciembre 1.133
Promedio Móvil
Centrado
Datos (Serie
Año Mes
originales desestacionalizada)
(Miles de
personas)
Julio 2.704 2.031,25
Agosto 2.729 2.026,00
Septiembre 2.429 2.017,25
2011
Octubre 2.184 2.005,75
Noviembre 1.565 1.996,13
Diciembre 1.516 1.991,50
Enero 1.402 1.987,42
Febrero 1.386 1.981,17
Marzo 1.697 1.974,21
2012
Abril 1.925 1.964,21
Mayo 2.054 1.951,29
Junio 2.292 1.938,33
Porcentaje
Promedio Móvil
sobre
Media Centrado
Media Móvil
Año Mes Datos Móvil (Serie
,(%)
12 meses desestacionalizada)
(Indice
(Miles de personas)
estacional)
Enero 1.444
Febrero 1.470
Marzo 1.823
Abril 2.075
Mayo 2.135
2011 Junio 2.322
2.033,00
Julio 2.704 2.031,25 133,12
2.029,50
Agosto 2.729 2.026,00 134,70
2.022,50
SERIES TEMPORALES 209
(a) El suceso seguro es que el resultado sea mayor o igual a 4 y menor o igual
a 12
(b) Un suceso compuesto es que el resultado de la suma de los dados sea
igual a 10.
( c) El suceso vacío imposible es cualquier valor menor que 2 y mayor que 12.
(d) Que la suma sea múltiplo de 3 no es un suceso aleatorio
La opción (b) es falsa porque los sucesos compuestos son los que están
formados por dos o más resultados del experimento, es decir, por dos o más
sucesos elementales. La opción (d) es falsa porque suceso aleatorio es
cualquier subconjunto del espacio muestra! E = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11,
12}; por ejemplo, que la suma sea múltiplo de 3 : = { 3, 6, 9, 12} .
(a) Si el suceso A está contenido en el suceso B (Ac !J) , se cumple que P (A)=
P (B) + P (B - A)
(b) Una propiedad de la Unión de sucesos es f\A u lJ) = f\A) + P(lJ) - f\A n lJ)
(c) Para cualquier suceso A siempre se verifica que la probabilidad de que
ocurra está comprendida entre O y 1, es decir, O ~ P (A) ~ 1
(d) Si A' es el suceso complementario de A, entonces la probabilidad de A'
será igual a: P (A') = 1 - P (A)
(a) El cociente entre el número de casos o elementos posi bles del experimento
y el número de casos favorables
(b) El cociente entre el número de casos favorables y el número de casos
posibles o elementos posi bles del experimento
(c) La frecuencia relativa a partir de repetir 100 veces el experimento
(d) La media del número de casos favorables cuando se repite el experimento
muchas veces.
Justificación: Las opciones (a), (c) y (d) son falsas porque, de acuerdo con la
Regla de Laplace, la probabilidad es el cociente entre el número de casos
favorables y el número de casos posibles o elementos posibles del
ex peri mento.
Justificación: Las opciones (a), (b) y (d) son falsas porque los sucesos A y B
son independientes si P (A/B) = P (A).
(a) 1/2
(b) 1/ 8
( c) 3/8
(d) 7/8
216 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
Justificación: Las opciones (a), (b) y (c) son falsas porque el suceso C,
consistente en obtener por lo menos una cara, solamente no se cumple
cuando el resultado consista en que salgan tres cruces, es decir se cumple
para los 7 casos restantes. Por lo tanto, aplicando la Regla de Laplace, al ser
el número de casos posibles 23 = 8, el valor de P (C) es 7/8. También se
puede obtener esta probabilidad, basándose en que la probabilidad del suceso
complementario del C, consistente en que salgan tres cruces, es 1/8, luego P
(C) = 1- (1/8) = 7/8.
T.8. 12. Suponiendo que un año tiene 365 días, la probabilidad de que
los cumpleaños de tres hermanos sean en el mes de junio (que tiene
30 días) es aproximadamente:
(a) 30/365
(b) 1/12
(C) 5,55 X 10-4
(d) Ninguna de las anteriores opciones es verdadera
Justificación: Las opciones (a) y (b) son falsas porque la probabilidad de que
los cumpleaños de tres hermanos sean en el mes de junio (que tiene 30 días)
es (30* 30* 30) / (365 * 365* 365) que es aproximadamente igual a 5,55 x 10·4 .
Este valor se obtiene aplicando la regla de Laplace, y que al tratarse de
sucesos independientes, la probabilidad de su intersección es el producto de la
correspondientes probabilidades (P (A n Bn c) = P (A) · P (B) · P (C)). La
opción ( d) es falsa porque la opción ( c) es verdadera
Justificación: Las opciones (a), (b) y (d) son falsas porque por la propia
definición de sucesos incompatibles: dos sucesos A y B, se llaman
incompatibles cuando no tienen ningún elemento común . Es decir, la igualdad
( An fl = </> ) se cumple si los sucesos son incompatibles.
INTRODUCCIÓN A LA PROBABILIDAD 217
Justificación: Las opciones (a), (b) y (c) son falsas porque se define como
suceso seguro aquel que ocurre siempre que se realice el experimento
aleatorio, por tanto su probabilidad es l.
Justificación: La opción (c) es falsa porque si los sucesos son depend ientes, P
(A n B) = P (A) · P (B/A) = P (B) · P (A/B).
¡-1
Solución: La opción (b ).
Justificación: Las opciones (a) y (c) son falsas porque la definición de suceso
complementario o suceso contrario del suceso A es como el suceso que se
verifica cuando no se verifica A. La opción (d) es falsa porque la opción (b) es
verdadera.
220 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍ STICA DE A DE
Solución: La opción (b ).
Justificación: Las opciones (a), (c) y (d) son falsas porque por la propiedad de
la Unión, M: Av b') = fiA) + M'.fi) - f-'\:A n B); pero si los sucesos A y B, son
incompatibles no tienen ningún elemento común, es decir, An !J = </J .
Justificación: Las opciones (a) y (b) son falsas porque por el teorema de la
1-_;
8.2. Problemas
(a) 16/40
(b) 36/40
(c) 28/40
(d) 10/40
Justificación: Las opciones (a), (b) y (d) son falsas porque, como se
demuestra a continuación, la probabilidad de que elegido un alumno al azar,
sea niño o tenga el pelo negro es 28/40.
Cálculo: Los sucesos que forman parte de la probabilidad a calcular son los
siguientes:
A: Ser niño
B: Tener el pelo negro
20
Asimismo: P(B)=
40
En nuestro caso como la probabilidad de que sea niño y tenga el pelo negro es
8/ 40;
16 20 8 28
P(A u 8) = -+ - - -~ P( Au B) = -
40 40 40 40
222 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
Justificación: Las opciones (b), (c) y (d) son falsas porque, como se demuestra
a continuación, la probabilidad de que la bola roja haya sido extraída de la
urna A es aproximadamente 0,26.
P (M) = 0,6
P (H) = 0,4
P (C/M) = 0,25
P (C/ H) = 0,35
A partir de los resultados anteriores y apl icando la probabilidad del suceso
complementario, de la intersección o probabilidad compuesta y en su caso el
Teorema de la probabilidad tota l, las probabilidades que se solicitan en cada
una de las cuatro cuestiones son las sigu ientes:
(a) La probabilidad de que las dos bolas sean rojas es 2/5 x 4/ 7 = 8/ 35.
(b) La probabilidad de que las dos bolas sean blancas es 3/5 x 3/7 = 9/ 35.
( c) La probabil idad de que una sola de las dos bolas sea blanca, es 1 - (9/35)
- (8/35) = 18/35 ya que ya que se trata del suceso complementario de los
sucesos consistentes en que salgan dos bolas blancas (cuya probabilidad
es 9/ 35) o dos bolas rojas (cuya probabilidad es 8/ 35) .
Cálculo: Para resolver este problema hay que tener en cuenta que si cada bola
se reemplaza después de su extracción se trata de sucesos independientes y
en este caso P (A n B) = P (A) · P (B). Por el contrario, si cada bola no se
reemplaza después de su extracción se trata de sucesos dependientes y en
este caso P (A n B) = P (A) · P (B/A). De acuerdo con ello, las probabil idades
que se solicitan son las siguientes :
P.8.6. En una pregunta de test con cuatro alternativas y con solo una
de ellas válida, un alumno conoce la respuesta con probabilidad 0,70.
En el caso de que sepa la respuesta, contesta acertadamente con una
probabilidad de 0,90, mientras que si no lo sabe, contesta
aleatoriamente, es decir, al azar. Indique la respuesta verdadera.
p (C) = 0,70
P (N) = 0,30
P (A/C) = 0,90
P {A/N) = 0, 50
Ft A) = M: Al C:) Ft f..,)+ Ft Al N) Ft N)
Ft A)= Ft Al f..,)M: f..,) + F\A I N)f\ N) = 0,90 X 0,70+ 0,50 X 0,30 = 0.78
INTRODUCCIÓN A LA PROBABILIDAD 227
ft N ) = 1- M: {,,) = 1- O. 7 =0,3
(a) La probabilidad de que sea mujer es de 2/5 y de que sea fumador y mujer
de 3/4
(b) La probabilidad de que no sea mujer es de 3/5 y de que no sea fumador
de 3/4
(c) La probabilidad de que sea fumador y universitario es de 7/ 10
(d) Todas las opciones son falsas
P (M) = 8/20
P (V) = 12/20
P (F) = 15/20
P (U) = 6/20
228 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
P (H) = 0,46
P (M) = 1- P (H) = 0,54
P (C/H) = 0,60
P (C/M) = 0,40
P (N/H) = 1- P (C/H) = 0,40
P (N/M) = 1- P (C/ M) = 0,60
P( N )= P( N / H )P( H )+ P( N / M )P(M)
Sustituyendo los valores correspondientes :
(c) Para calcular la probabilidad de que el estudiante tenga coche, basta con
considerar que dicho suceso es el complementario del suceso, el
estudiante no tenga coche. Por tanto:
P( l ) = P( {.,' / H) P( H) + P( {.,' / M ) P( M )
P.8.9. Se tiene una caja que contiene 6 bolas rojas, 4 bolas blancas y
5 bolas azules. Indique la respuesta falsa.
Cálculo: Para resolver este problema hay que tener en cuenta que si cada bola
se reemplaza después de su extracción se trata de sucesos independientes y
en este caso P (A n B) = P (A) · P (B). Por el contrario, si cada bola no se
reemplaza después de su extracción se t rata de sucesos dependientes y en
este caso P (A n B) = P (A) · P (B/A). De acuerdo con ello, las probabilidades
que se solicitan son las siguientes:
Cálculo: Para facilitar los cálculos en la tabla adjunta se muestran todas las
sumas totales de filas y columnas.
P( Au 8) = P( A) + P( 8)- P( A n 8) .
ft'O defectos) =1- ft' 1o más defectos)= 1- (O, 18 + 0,08 + 0.04 + 0,01 ) =0.69
INTRODUCCIÓN A LA PROBABILIDAD 233
(c) La probabilidad de que tenga tres o más defectos es 0,05. Para calcular
dicha probabilidad se aplica la propiedad de la Unión de sucesos:
rt Av B) = f1'. A) + P(, 8)- f1'. An B). Es decir, teniendo en cuenta que son
sucesos disjuntos y por tanto la probabilidad de la intersección es nula, P
(tenga tres o más defectos) = P (tenga tres defectos v tenga cuatro o
más defectos) = P (tenga tres defectos) + P (tenga cuatro o más
defectos) = 0,04 + 0,01 = 0,05.
(a) La probabilidad de que haya salido cara y se haya extraído una bola azul,
es aproximadamente 0,25
(b) Si sólo se sabe que la bola obtenida es negra, la probabilidad de que dicha
bola estuviera en la primera urna es aproximadamente 0,474
(c) Si sólo se sabe que la bola obtenida es negra, la probabilidad de que dicha
bola estuviera en la primera urna es aproximadamente 0,374
(d) Ninguna de las anteriores es verdadera
Solución: La opción (b ).
fXC)=~
2
fXX)=~
2
La primera probabilidad que hay que calcular es la de que haya salido cara y
se haya extraído una bola azul:
P (S) = 0,18
P (M) = 0,42
P (P) = 0,30
P (N) = 0,10
P (A/ S) = 0,20
P (A/ M) = 0,30
P (A/ P) = 0,35
P (A/ N) = 0,40
(b) Para calcular la probabilidad de que la persona escogida sea aficionada del
club " campeón", aplicamos el teorema de la probabilidad total, es decir:
M: A)= 0,20 x 0,18 + 0.30 x 0,42 + 0,35 x 0,30 + 0,40 x 0,10 = 0,307
236 EJERCICIOS DE TEST PARA INTRODUCCIÓN A LA ESTADÍSTICA DE ADE
BIBLIOGRAFÍA
ARNALDOS, F.; DÍAZ, M.; FAURA, U.; MOLERA, M. y PARRA, l.: Estadística
Descriptiva para Economía y Administración de Empresas. AC, 2002.
ARIAS MARTÍN, C.; CARO RUIZ, J.; MÁRQUEZ DE LA PLATA Y CUEVAS, V.;
PAJARES RUIZ, A.: Distribuciones de frecuencias unidimensionales. Grupo
Editorial Atril 97 S. L., 1999.
ARIAS MARTÍN, C.; CARO RUIZ, J.; MÁRQUEZ DE LA PLATA Y CUEVAS; V.;
PAJARES RUIZ, A. : Distribuciones de frecuencias bidimensionales. Edición
Digital @tres, S.L.L., 2000.
ARIAS MARTÍN, C.; CARO RUIZ, J.; GONZÁLEZ GONZÁLEZ, A.; MÁRQUEZ DE
LA PLATA Y CUEVAS, V.; PAJARES RUIZ, A.: Lecciones de Estadística
Descriptiva. Edición Digital @tres, S. L. L., 2001.
CASAS SÁNCHEZ, J. M.; GARCÍA PÉREZ, C.; RIVERA GARCÍA, L. F.: Problemas
de estadística: descriptiva/ probabilidad e inferencia. Pirámide, 1998.
1 1 """"
9 788492 1