Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Excel Y La Estadistica - P. Vidales
Excel Y La Estadistica - P. Vidales
Ejercicios resueltos
2
P.VIDALES
3
1.3 ENTORNO DE EXCEL 2013, 2010 Y 2007. LIBROS Y HOJAS DE
CÁLCULO
1 3.1 Introducción de datos y fórmulas
1 3.2 Series de datos. Autocompletar
1.4 FÓRMULAS
1.4.1 Barra de fórmulas
1.4.2 Rellenar una hoja mediante una fórmula
1.5 OPERADORES
1 5.1 Orden de los operandos y preferencia de los operadores en las
fórmulas
1 5.2 Tipos de operadores
1 5.3 Fórmulas matriciales
1 5.4 Paleta de fórmulas
1 5.5 Rangos con nombre
1.6 V NCULACIÓN DE L BROS
1 6.1 Crear una fórmula para calcular datos en otra hoja o en otro libro
1 6.2 Vínculo a una hoja de cálculo en otro libro
1.7 MOSTRAR FÓRMULAS Y VALORES EN UNA HOJA DE CÁLCULO
1.8 FUNCIONES DE HOJA DE CÁLCULO
1 8.1 Funciones anidadas dentro de funciones
1 8.2 Categorías de funciones en Excel 2010
1.9 COMPLEMENTOS EN EXCEL Y LA ESTADÍSTICA
5
2.4 FORMALIZAR LAS DISTR BUCIONES DE FRECUENCIAS
2.5 REPRESENTAR DISTRIBUCIONES DE FRECUENCIAS
2 5.1 Representaciones para variables cualitativas: diagramas de
rectángulos, diagramas de sectores y pictogramas
2 5.2 Representaciones para variables cuantitativas sin agrupar:
diagramas de barras, en escalera y polígonos de frecuencias
2 5.3 Representaciones para variables cuantitativas agrupadas:
histogramas y polígonos de frecuencias simples y acumulados
2.6 GRÁFICOS EN EXCEL
2.7 EXCEL Y LAS DISTR BUCIONES DE FRECUENCIAS
2.7.1 La función FRECUENCIA de Excel
2.7.2 Distribuciones de frecuencias e histogramas con herramientas de
análisis de Excel
6
4.15 EXCEL Y LA CORRELACIÓN MÚLT PLE CON HERRAMIENTAS DE
ANÁLISIS
4.15.1 Correlación y matriz de correlaciones
4.15.2 Covarianza y matriz de covarianzas
4.16 EXCEL Y LAS TABLAS DE CONTINGENCIA MEDIANTE TABLAS
D NÁMICAS
4.16.1 Excel y las tablas de contingencia para dos variables cualitativas
4.16.2 Excel y las tablas de contingencia para dos variables, una
cualitativa y otra cuantitativa
4.16.3 Excel y las tablas de contingencia para más de dos variables
4.17 EXCEL Y LOS CONTRASTES DE ASOCIACIÓN E
INDEPENDENCIA
8
5.13 TASAS DE VARIACIÓN
5.14 MED DAS DE CONCENTRACIÓN
5.15 ÍNDICE DE CONCENTRACIÓN DE G NI
5.16 CURVA DE CONCENTRACIÓN DE LORENTZ
9
1.1 INTRODUCCIÓN
La estadística es una materia en alza, en una época en la que los
datos son un activo muy importante y el análisis cuantitativo tiene aplicaciones
muy relevantes en diferentes campos de la ciencia como la economía, las
finanzas, la ingeniería, la matemática en general, la sociología, la psicología, la
biología, la medicina, etc. Es clave para empezar a trabajar en estadística, sea
cual sea el campo en que se aplique, la comprensión de los propios conceptos
estadísticos, para posteriormente realizar la operatoria matemática necesaria
para desarrollarlos a través del software, que facilita obtener los resultados de
los procedimientos estadísticos de forma rápida y con menos errores que cuando
las operaciones se realizaban manualmente.
11
Por otra parte, Excel también implementa determinados
complementos para ampliar el campo de trabajo en diferentes áreas. Uno de
estos complementos lo constituyen las Herramientas para análisis que se
insertan en el grupo Análisis de la ficha Datos de la cinta de opciones de Excel.
Al final de este capítulo se muestra la forma de utilizar estos complementos en
Excel.
15
1.3 ENTORNO DE EXCEL 2013, 2010 Y 2007. LIBROS Y
HOJAS DE CÁLCULO
Al iniciar Excel 2013, 2010 0 2007 se observa un entorno de
trabajo similar. La Figura 1-3 muestra el entorno de Excel 2010, pero las otras
versuiiones presentan un entorno idéntico y las posibilidades de rabajo en
Estadístiva Descriptiva son similares. Destacan la Cinta de opciones con sus
fichas y sus grupos de opciones en cada ficha, la barra de herramientas de
acceso rápido y la barra de estado con los botones de visualización y el Zoom.
16
funciones, etc.
18
desplazamiento que se pueden utilizar para pasar de una hoja de cálculo a la
siguiente o para hacer desplazamientos de un lugar a otro dentro de la hoja de
cálculo activa.
19
Un valor numérico puede ser un entero (como 32), un número
decimal (como 499,95), una fracción entera (como 10 3/4), o un número en
notación científica (como 4,09 E+13). En los números, se pueden utilizar
símbolos matemáticos, como el símbolo de suma (+), el de resta (-), el de tanto
por ciento (%), fracciones (/) y exponenciales (E). Asimismo, es posible utilizar
el símbolo de dólar ($). Si se introduce un número demasiado grande como para
ser presentado en una celda, Excel mostrará el número en notación científica o
mostrará ####### en la celda, para advertirle de que necesita incrementar el
ancho de la misma.
21
el número deseado. Esto no afectará a los datos que haya indicado en las celdas
antes de seleccionar la opción Número fijo de decimales. Para anular
temporalmente la opción Número fijo de decimales, especifique un separador de
decimales al escribir el número. Se pueden elegir los caracteres para separar
decimales y miles con las opciones Usar separadores del sistema, Separadores
de decimales y Separadores de miles de la Figura 1-8.
26
Figura 1-8
28
También es posible especificar el tipo de serie de relleno
utilizando el botón secundario del ratón para arrastrar el controlador de relleno
sobre el rango y después hacer clic en el comando adecuado del menú contextual
de la Figura 1-16. Por ejemplo, si el valor inicial es la fecha ENE-2002, haga clic
en Rellenar meses para obtener la serie FEB-2002, MAR-2002, etc. También
puede hacer clic en Rellenar años para obtener la serie ENE-2003, ENE-2004,
etc.
32
41
49
% Porcentaje
^ Exponente
* y/ Multiplicación y división
+ y- Suma y resta
& Conecta dos cadenas de texto (concatenación)
= < > <= >= <> Comparación
51
1.6 VINCULACIÓN DE LIBROS
Pueden compartirse los datos almacenados en hojas de cálculo y
libros diferentes mediante la utilización de vínculos o de referencias externas. La
vinculación resulta especialmente útil cuando no conviene conservar grandes
modelos de hoja de cálculo en el mismo libro.
61
el nombre de la otra hoja de cálculo o del otro libro contiene caracteres no
alfabéticos, se deberá poner el nombre (o la ruta de acceso) entre comillas
sencillas.
65
funciones de texto (Figura 1-53) y las funciones lógicas (Figura 1-54).
77
79
1.9 COMPLEMENTOS EN EXCEL Y LA ESTADÍSTICA
Como ya habíamos anticipado al principio del cap tulo, Excel 2010
dispone de complementos adicionales (Herramientas para análisis, Solver, etc.)
que pueden cargarse después de la instalación del programa y que incorporan
funcionalidades adicionales para el trabajo en estadística. Para cargar o
descargar un complemento de Excel, se tendrán en cuenta los pasos siguientes:
87
2.1 VARIABLES ESTADÍSTICAS
En el trabajo estadístico la información se recoge en variables.
Estas variables se organizan de forma ordenada y se almacenan en ficheros.
Posteriormente será posible operar con estas variables y aplicar funciones a las
mismas para realizar las transformaciones y los análisis estadísticos que se
desee. Las variables pueden contener datos numéricos (variables cuantitativas)
y datos categóricos no cuantificables numéricamente (variables cualitativas). El
sexo, la profesión y el lugar de origen serían variables cualitativas. La estatura y la
edad serían ejemplos de variables cuantitativas.
92
“satisfacción en el trabajo” pueden ordenarse en “satisfación baja” (valores entre
0 y 10 según una determinada escala de puntuación que varía entre 0 y 30),
“satisfación media” (valores entre 10 y 20) y “satisfacción alta” (valores entre 30 y
40).
93
2.2 DISTRIBUCIONES DE FRECUENCIAS Y SU
FINALIDAD
Cuando se analiza una característica medida por una variable
cualquiera resultado de un determinado proceso (de producción, de medida,
económico, financiero, sociológico, médico, biológico, demográfico, etc.), los
datos que obtenemos siempre están dispersos y nunca tienen un único valor
constante. Una vez que sabemos que los datos relativos a las distintas
características van a estar dispersos, nos surge el problema de detectar el
patrón en la variabilidad de los datos. Para ayudar a esta tarea existen
herramientas estadísticas básicas como las distribuciones de frecuencias y los
histogramas, así como técnicas sencillas de análisis exploratorio de datos.
94
de los datos. Se construye la última clase finalizando con un límite superior sólo
un poco mayor que el valor más grande de los datos. Para realizar el histograma
se marcan las clases sobre el eje de abscisas, y sobre cada clase se levanta un
rectángulo de altura proporcional al número de observaciones de la variable
(frecuencia absoluta) que caen en la clase.
95
variable estudiada.
96
2.3 INTERPRETAR LAS DISTRIBUCIONES DE
FRECUENCIAS
Las distribuciones de frecuencias facilitan que todo el mundo vea y
comprenda intuitivamente la forma de los valores de la variable que representa.
Sin embargo hay que prestar atención a la interpretación de las distribuciones.
Cuando se miran las distribuciones de frecuencias, se tiene que prestar atención
a los puntos siguientes:
97
98
2.5 REPRESENTAR DISTRIBUCIONES DE
FRECUENCIAS
El objetivo esencial de las representaciones gráficas de las
distribuciones de frecuencias es obtener una idea general sobre sus
propiedades en un simple vistazo. Observando un histograma de frecuencias
podemos deducir si la variable se aproxima a la normalidad o si es simétrica, así
como otras propiedades que posteriormente pueden ser analizadas de modo
formal utilizando contrastes u otras herramientas adecuadas.
102
frecuencias es el polígono de frecuencias acumuladas, que se utiliza cuando se
trabaja con frecuencias absolutas o relativas acumuladas y que se construye
levantando en el extremo superior de cada intervalo de clase una ordenada igual
a la frecuencia acumulada correspondiente y uniendo a continuación dichas
ordenadas.
Los puntos que se unen serán (Li+1, Ni). La primera ordenada se une
al extremo inferior del primer intervalo prolongándose el polígono desde este
punto hacia la izquierda sobre el eje X, y prolongándose también el polígono a
partir de la ordenada del extremo superior del último intervalo con una paralela
al eje de abscisas. De esta forma, la ordenada correspondiente a cada valor de
la variable X mide el número de observaciones para las cuales la variable toma
valores menores o iguales que la abscisa (concepto que aproxima la función de
distribución de la variable X).
116
2.6 GRÁFICOS EN EXCEL
La forma más habitual de crear un gráfico en Excel consiste en
seleccionar los datos para la construcción del gráfico en la hoja de cálculo y
utilizar el tipo de gráfico que se quiera crear del grupo Gráficos de la ficha
Insertar (Figura 2-13) en la que hemos seleccionado el tipo Línea (gráficos de
líneas). También se pueden utilizar los tipos Columna (Figura 2-14), Barra
(Figura 2-15), Circular (Figura 2-16), Área (Figura 2-17), Dispersión (Figura
2-18) y Otros gráficos (Figura 2-19). Es posible ver todos los tipos de gráfico
disponibles haciendo clic en la opción Todos los tipos de gráfico cualquier
Figura anterior. Se obtiene la Figura 2-20.
119
la Figura 2-21) que contiene las tres fichas Diseño, Presentación y Formato que
permiten la edición de un gráfico ya existente. La ficha Diseño permite cambiar el
tipo de gráfico, los datos del mismo, los diseños a utilizar, los estilos y la
ubicación. La ficha Presentación (Figura 2-22) permite trabajar con el área del
gráfico, etiquetas, t tulos, ejes, fondos, líneas de tendencia y todos los elementos
habituales que componen un gráfico. La ficha Formato (Figura 2-23) permite
trabajar con estilos de forma, estilos de Word Art, así como con el tamaño y la
organización del gráfico.
128
2.7 EXCEL Y LAS DISTRIBUCIONES DE FRECUENCIAS
Excel permite trabajar con distribuciones de frecuencias por dos vías
distintas. Por un lado, aporta la función FRECUENCIA, disponible desde las
primeras versiones del programa. Por otro lado, el complemento de Análisis de
datos incorpora la opción Histograma, que permite hallar distribuciones de
frecuencias para variables aleatorias cuantitativas y representarlas mediante los
correspondientes histogramas de frecuencias.
131
2.7.1 La función FRECUENCIA de Excel
La función FRECUENCIA de Excel calcula las frecuencias
absolutas de los valores de una variable en un rango de intervalos o grupos
cuyos extremos se conocen. Debe introducirse como una fórmula de matrices,
debido a que FRECUENCIA devuelve una matriz. Su sintaxis es la siguiente:
FRECUENCIA(datos;grupos)
132
Haga clic en la opción En una hoja nueva para insertar una hoja
nueva en el libro actual y pegar los resultados comenzando por la celda A1 de la
nueva hoja de cálculo. Para asignar un nombre a la nueva hoja de cálculo,
escríbalo en el cuadro.
142
Dado que estamos ante una variable cuantitativa con datos sin agrupar
podemos representarla mediante el diagrama de barras o mediante el polígono
de frecuencias (Figura 2-47) obtenidos mediante los mismos pasos del ejercicio
anterior.
161
detectar qué patrón sigue dicha variabilidad para determinar mejor la estructura
de los datos. En primer lugar será conveniente realizar una ordenación de los
datos según su magnitud, es decir, una tabla de frecuencias, que aportará algo
de luz sobre la distribución de frecuencias subyacente.
170
Figura 2-64
185
Figura 2-65
187
3.1 EXPRESIÓN CUANTITATIVA DE LAS
DISTRIBUCIONES
En el capítulo anterior se han definido los conceptos básicos en el
estudio de una distribución de frecuencias de una variable. En el presente
cap tulo estudiaremos las distintas formas de resumir dichas distribuciones
mediante medidas de posición (o de centralización), teniendo presente el error
cometido en el resumen mediante las correspondientes medidas de dispersión. A
su vez, analizaremos la forma de la distribución mediante las medidas de forma.
El histograma de frecuencias ya nos daba una representación visual de las tres
propiedades más importantes de los datos muestrales relativos a variables: la
forma de su distribución, su tendencia central y su dispersión. Ahora se trata de
cuantificar estos conceptos.
Por otra parte, también en este cap tulo se tratan las técnicas de análisis
exploratorio de datos, que amplían la información ofrecida por las medidas de
concentración, dispersión y forma de una distribución. Mediante las técnicas de
análisis exploratorio se estudian exhaustivamente las distribuciones de
frecuencias y se detectan las posibles anomalías que presentan las
observaciones.
189
3.2 MEDIDAS DE POSICIÓN: MEDIA, MEDIANA,
MODA, CUANTILES, PERCENTILES Y
MOMENTOS
La finalidad de las medidas de posición es encontrar unos valores
que sinteticen las distribuciones de frecuencias. En vez de manejar todos los
datos sobre las características o variables, tarea que puede ser pesada,
podemos caracterizar su distribución de frecuencias mediante algunos valores
numéricos, eligiendo como resumen de los datos un valor central alrededor del
cual se encuentran distribuidos los valores de la variable. El valor de la variable
elegido para representar a una distribución se llama promedio o medida de
posición, y es un valor representativo de todos los valores que toma la variable.
Debe hallarse entre el mayor y el menor valor de la variable.
190
3.3 MEDIDAS DE DISPERSIÓN
Las medidas de dispersión permiten calcular la representatividad de una
medida de posición, para lo cual será preciso cuantificar la distancia de los dife-
rentes valores de la distribución respecto a dicha medida. A tal distancia es a lo
que, en términos estadísticos, denominaremos variabilidad o dispersión de la
distribución. Las medidas de dispersión tienen como finalidad estudiar hasta qué
punto, para una determinada distribución de frecuencias, las medidas de
tendencia central o de posición son representativas como síntesis de toda la
información de la distribución. Medir la representatividad de una medida de
posición equivale a cuantificar la separación de los valores de la distribución
respecto a dicha medida. Por ejemplo, si queremos estudiar en qué grado una
media aritmética nos marca una tendencia central generalizable del
comportamiento de todos los elementos del conjunto estudiado, tendremos que
fijarnos en la separación o desviación de cada valor respecto a la media. Si
todos los valores están cercanos al valor medio, éste será representativo de
ellos.
199
Índice de dispersión respecto a la mediana: Se usa para resolver el problema de
comparación de medianas de varias distribuciones, que pueden venir, en general,
en unidades diferentes. Se define como la relación por cociente entre la
desviación media respecto de la mediana y la mediana aritmética VMe = DMe /
M e. Evidentemente, a menor índice de dispersión mejor es la mediana.
204
3.5 ANÁLISIS EXPLORATORIO DE DATOS
Los estadísticos descriptivos más habitualmente utilizados han
sido la media y la desviación típica. Sin embargo, el uso automático de estos
índices no es muy aconsejable. La media y la desviación típica son índices
convenientes sólo cuando la distribución de datos es aproximadamente normal o,
al menos simétrica y unimodal. Pero las variables objeto de estudio no siempre
cumplen estos requisitos. Por lo tanto es necesario un examen a fondo de la
estructura de los datos.
211
3.6 GRÁFICO DE SIMETRÍA
El gráfico de simetría (Figura 3-1) es una herramienta que
permite analizar visualmente el grado de simetría de una variable. En el eje de
abscisas se representan las distancias de los valores de la variable a la mediana
que quedan por debajo de ella, y en el eje de ordenadas se representan las
distancias de los valores de la variable a la mediana que quedan por encima de
ella. Si la simetría fuese perfecta, el conjunto de puntos resultante sería la
diagonal principal. Mientras más se aproxime la gráfica a la diagonal más
simetría existirá en la distribución de la variable.
212
la mediana.
214
del rango de entrada están organizados en filas o en columnas.
Nivel de confianza para la media: active esta casilla si desea incluir una fila
correspondiente al nivel de confianza de la media en la tabla de resultados. En el
cuadro, escriba el nivel de confianza que desee utilizar. Por ejemplo, un valor de
95% calculará el nivel de confianza de la media con un nivel de importancia del
5%.
Késimo mayor: active esta casilla si desea incluir una fila correspondiente al
valor k-ésimo mayor de cada rango de datos en la tabla de resultados. En el
cuadro, escriba el número que va a utilizarse para k. Si escribe 1, esta fila
contendrá el máximo del conjunto de datos.
Késimo menor: active esta casilla si desea incluir una fila correspondiente al
valor k-ésimo menor de cada rango de datos en la tabla de resultados. En el
cuadro, escriba el número que va a utilizarse para k. Si escribe 1, esta fila
contendrá el mínimo del conjunto de datos.
En una hoja nueva: haga clic en esta opción para insertar una hoja nueva en el
libro actual y pegar los resultados comenzando por la celda A1 de la nueva hoja
236
de cálculo. Para darle un nombre a la nueva hoja de cálculo, escr balo en el
cuadro.
En un libro nuevo: haga clic en esta opción para crear un nuevo libro y pegar los
resultados en una hoja nueva del libro creado.
237
Figura 3-25
251
Dado el valor positivo del coeficiente de asimetría de Pearson, se
concluye que la distribución es simétrica positiva.
286
Capítulo 4
287
4.1 DISTRIBUCIONES BIDIMENSIONALES DE
FRECUENCIAS
Si X e Y son dos variables observadas, la distribución bidimen-
sional (X,Y) será (xi,yi,nij). Cada frecuencia corresponde ahora a un par de
valores (variables cuantitativas) o modalidades (variables cualitativas): el primer
elemento del par corresponde al valor de la primera característica observada, el
segundo hace referencia a la segunda de tales características, y el tercero a la
frecuencia conjunta. Evidentemente, sería posible realizar un estudio por
separado de la distribución de X e Y, y resumir estos caracteres por medio de
sus medidas de posición y dispersión descritas en el cap tulo anterior; tales
distribuciones recibirán el nombre de distribuciones marginales. Sin embargo,
nuestro interés en este punto se centra en el análisis simultáneo de ambas
características; es decir, en la distribución conjunta de las mismas, con el fin de
establecer si existe relación entre ellas y en qué grado. Los pares que contienen
los valores de las variables o atributos junto con sus correspondientes
frecuencias, suelen disponerse en una tabla de doble entrada, que recibe el
nombre de tabla de correlación en el caso de que ambos caracteres sean
cuantitativos, y tabla de contingencia cuando son cualitativos. Estos dos tipos de
tablas serán objeto de nuestra atención en los apartados siguientes.
288
4.2 TABLA DE CORRELACIÓN: DISTRIBUCIONES
MARGINALES Y DISTRIBUCIONES
CONDICIONADAS
Queremos estudiar conjuntamente dos caracteres cuantitativos, X e Y,
sobre una población, apareciendo X con h niveles e Y con k. Para ello,
seleccionamos una muestra de tamaño N y la sometemos a observación,
disponiendo los resultados en una tabla de doble entrada, donde x1, ..., xh e y1,
..., yk representan los valores observados para cada variable, y nij la frecuencia
absoluta conjunta, es decir, las veces que aparecen simultáneamente el valor i-
ésimo de X y j-ésimo de Y.
289
nij = frecuencia absoluta del valor (Xi,Yj) de la distribución conjunta (X,Y).
290
= frecuencia absoluta del valor Yj de la variable
marginal Y.
Se cumple que:
291
En esta tabla, ni. y n.j nos proporcionan las frecuencias marginales. Es
decir, el número de veces que aparece el valor i-ésimo de X, con independencia
de cuál sea el valor de Y, es ni., y el número de veces que aparece el valor j-
ésimo de Y, independientemente de cuál sea el valor de X con el que se da
conjuntamente Y, es n.j. De esta forma tenemos que las distribuciones
marginales de X e Y vienen dadas por (xi; ni.) y (yj; n.j ). Estas distribuciones
marginales pueden expresarse como sigue:
292
A partir de la tabla de correlación es posible formar un nuevo tipo de
distribuciones, que denominaremos distribuciones condicionadas debido a que
para su obtención es preciso definir previamente una condición. Esta condición
hará referencia a la fijación a priori de un valor (o valores) de una de las
variables, para posteriormente calcular la distribución de la otra variable sujeta a
esa condición. Si fijamos la variable Y en el valor y2 (podríamos fijar más de un
único valor), la distribución de la variable X condicionada a que Y tome el valor
y2 vendrá dada por:
Donde X/Y=y2 nos dará los valores que puede tomar la variable X cuando
Y toma el valor y2, y ni/j=2 nos da las frecuencias con que se presenta cada uno
de los valores.
293
Dado que estas distribuciones condicionadas son variables
unidimensionales, es posible calcular todo tipo de medidas de centralización,
dispersión y forma, mediante los procedimientos ya vistos en el capítulo anterior.
294
Otra relación importante entre distribuciones condicionadas, marginales y
conjunta es la siguiente:
295
4.3 COVARIANZA
Pero, puesto que no interesan únicamente las distribuciones
marginales, sino también la conjunta, es preciso introducir medidas que hagan
referencia a esta última distribución.
296
La covarianza es una medida de gran importancia por su signo, más que
por el valor que pueda alcanzar; el signo indica el sentido de la variación
conjunta de las variables que estamos considerando. De esta forma, si la
covarianza es positiva, quiere decir que ambas variables varían en el mismo
sentido alrededor de sus medias, mientras que si la variación de las mismas
tiene lugar en sentido contrario, la covarianza tomará valores negativos.
297
4.4 VARIABLES INDEPENDIENTES
¿Cómo podemos detectar la existencia de independencia entre dos
variables? ¿qué instrumentos estadísticos son los que nos permiten señalar la
ausencia de tal relación? Para detectar la no presencia de asociación entre dos
caracteres analizados sobre la misma población, se procede a elaborar la tabla
de correlación (para variables cuantitativas) o de contingencia (para variables
cualitativas), y se calculan las respectivas distribuciones conjuntas, marginales y
condicionadas. Las variables son independientes si se cumple cualquiera de las
dos siguientes condiciones equivalentes:
Las frecuencias relativas condicionadas coinciden con sus respectivas
frecuencias relativas marginales, lo que nos indica que el
condicionamiento, en cuanto tal, no existe. Ha de cumplirse que fi/j = fi.= ni.
/N y fj/i =f.j= n.j /N para todo i,j.
298
4.5 COEFICIENTE DE CORRELACIÓN LINEAL ENTRE
DOS VARIABLES. REGRESIÓN SIMPLE
MÍNIMO CUADRÁTICA
Se llama correlación al grado de dependencia mutua entre dos
variables. El coeficiente de correlación intenta medir la intensidad con que dos
variables están relacionadas. Este concepto está directamente relacionado con el
concepto de curva de regresión. Mediante la regresión simple mínimo
cuadrática, se expresa la estructura funcional de la relación existente entre dos
variables, ajustando la nube de puntos dada por los pares de valores de las dos
variables a una curva de la forma mejor posible (minimizando la varianza del
error). El ajuste será de la forma Y=f(x)+e o X=f(Y)+e, donde e denota el error
cometido cuya varianza debe ser mínima. El coeficiente de correlación mide la
calidad de ese ajuste.
, c= yd = .
299
.
300
Y= a+ bX = + xÞ
301
menor a medida que r se acerca más a cero. Si - 1 < r < 0 la correlación es
negativa, pero el grado de asociación entre las dos variables será mayor a
medida que r se acerca más a -1, y será menor a medida que r se acerca más a
cero.
302
de asociación (parabólica, exponencial, etc.)
303
4.6 REGRESIÓN PARABÓLICA
304
de mínimos cuadrados.
305
4.7 REGRESIÓN POLINÓMICA
306
normales proporcionan la ecuación polinómica que mejor ajusta los datos en el
sentido de mínimos cuadrados.
307
4.8 REGRESIÓN HIPERBÓLICA, POTENCIAL Y
EXPONENCIAL
Si suponemos el ajuste de la forma Y = a + b / X + e (curva de regresión
hiperbólica de Y sobre X), podemos realizar la transformación Z=1/X, con lo que
la ecuación a ajustar resulta ser Y = a + b Z + e (curva de regresión lineal de Y
sobre X), regresión que ya sabemos resolver. Una vez realizado el ajuste se
deshace el cambio en la ecuación resultante.
308
4.9 COEFICIENTE DE CORRELACIÓN POR RANGOS
Es muy típico considerar, sobre todo en variables cualitativas, el
coeficiente de correlación entre los rangos de los valores de las variables. Se
entiende por rango de un valor de una variable el lugar que ocupa dicho valor en
el conjunto total de valores de la variable, suponiendo una ordenación de menor a
mayor. Sean Ai y Bi las diferentes modalidades de dos variables cualitativas X e
Y. Sean xi e yi los rangos o números de orden que le corresponden a Ai y Bi,
supuestas ordenadas estas modalidades, con la escala que se determine, y de
menor a mayor. Se define el coeficiente de correlación por rangos de Spearman
para las variables cualitativas X e Y como el coeficiente de correlación lineal de
las variables cuyos valores son xi e yi.
309
4.10 DISTRIBUCIONES DE MÁS DE DOS
DIMENSIONES: MATRIZ DE COVARIANZAS Y
MATRIZ DE CORRELACIONES
Cuando se tiene una variable tridimensional (X,Y,Z) o enedimensional
en general, también se puede realizar la descripción y análisis de las
distribuciones de frecuencias subyacentes. La complejidad crece cuando el
número de variables o factores que se analizan simultáneamente aumenta, pero
conocido el procedimiento para el caso tridimensional, su gener alización al n-
dimensional es inmediata. El análisis es igualmente válido cuando los caracteres
analizados son de naturaleza cuantitativa o cualitativa.
310
donde cada sij representa la covarianza entre Xi y Xj para todo i,j.
311
donde cada rij es el coeficiente de correlación entre Xi y Xj para todo i,j.
Si dada una serie de variables X1, X2, ..., Xn, se trata de estudiar el grado
de dependencia simultánea entre todas ellas (o bien entre grupos de ellas),
puede utilizarse la matriz de correlaciones. Si en base a la intensidad con que
dependen se puede establecer una función que explique una variable mediante
todas las demás, que se supone son sus causas influyentes, estamos ante un
problema de regresión múltiple, que será estudiado en cap tulos posteriores.
312
4.11 VARIABLES CUALITATIVAS: TABLAS DE
CONTINGENCIA Y DISTRIBUCIONES
MARGINALES Y CONDICIONADAS
En los apartados anteriores hemos trabajado con variables cuyos
valores son cuantificables numéricamente, es decir, hemos estudiado la
denominada estadística de variables, que incluye las diferentes técnicas para
analizar la información disponible acerca de un determinado fenómeno colectivo
cuyos sucesos vienen expresados en términos cuantitativos o numéricos (renta,
salarios, precios, etc.). Sin embargo, cuando esos sucesos vienen referidos a
cualidades o características no medibles del fenómeno estudiado (color,
nacionalidad, enfermedades, etc.), estaremos hablando de lo que definimos como
estadística de atributos, que se ocupa de las variables cualitativas.
313
individuos que presentan a la vez las modalidades A¡ y Bj. La tabla estadística
que describe estos N individuos, denominada tabla de contingencia, será una
tabla de doble entrada como la siguiente:
Al igual que en el caso de las variables cuantitativas, en esta tabla ni. y n.j
nos proporcionan las frecuencias marginales; es decir, el número de veces que
aparece la modalidad i-ésima de A, con independencia de cuál sea la modalidad
de B, es ni., y el número de veces que aparece la modalidad j-ésima de B,
independientemente de cuál sea la modalidad de A con el que se da
314
conjuntamente B, es n.j. De esta forma tenemos que las distribuciones
marginales de A y B vienen dadas por (Ai; ni.) y (Bj; n.j).
Donde A/B2 nos dará los valores que puede tomar la variable A cuando la
B toma el valor B2, y ni/2 nos da las frecuencias con que se presenta cada uno de
los valores (modalidades).
315
Para todas las distribuciones será posible trabajar con frecuencias
relativas en vez de con frecuencias absolutas.
316
4.12 INDEPENDENCIA Y ASOCIACIÓN DE VARIABLES
CUALITATIVAS: COEFICIENTES
En cuanto a la independencia de variables cualitativas, ya fue tratada al
hablar de la independencia de variables cuantitativas, aunque este concepto toma
aquí especial relevancia, pues en el caso de variables cualitativas la falta de
independencia suele denominarse asociación, y el análisis del grado de
asociación entre variables cualitativas tiene fuerte incidencia en la estadística de
atributos. Ya hemos visto que de forma análoga a lo que ocurre en el caso de dos
variables cuantitativas, la observación simultánea de dos atributos da lugar a una
tabla de doble entrada, en donde nij indica el número de objetos o individuos que
poseen conjuntamente las modalidades indicadas en la fila i-ésima y en la
columna j-ésima de la tabla de contingencia. También hemos visto que las
distribuciones que se refieren a uno solo de los dos atributos o variables
cualitativas se denominan igualmente distribuciones marginales.
317
c2=
c2=
318
c2=
F2 = c 2/N =
319
Coeficiente de contingencia C de K. Pearson: Se trata de un coeficiente
definido como C = (c 2/(N+c 2)) 1/2. El coeficiente C tiene un campo de
variación entre 0 y 1, de manera que su valor es cero cuando existe una
carencia absoluta de asociación entre los atributos, o sea, cuando los
atributos son independientes. Cuando los atributos muestran una total
asociación entre sí, el coeficiente se aproxima a uno, pero sólo se
alcanzaría el valor uno en el caso ideal de infinitas modalidades. Se puede
demostrar que en el caso de una tabla de contingencia cuadrada (h=k), el
límite superior de C es S=((h-1)/h) 1/2, lo que permitiría calcular un nuevo
valor para esta medida, llamado coeficiente ajustado, que vendría dado por
CA=C/S. Este coeficiente ajustado podría resultar de interés, puesto que
proporciona una idea del verdadero grado de asociación, al evaluar la
discrepancia entre el valor obtenido y el máximo que podría alcanzar para
la tabla dada. La expresión del coeficiente de contingencia C de K. Pearson
será:
320
También se cumple que:
donde m = min(h-1,k-1)
321
De la misma forma, suponiendo que se ha elegido X como factor
explicado e Y como explicativo, se evalúa la capacidad de Y para predecir X
mediante el coeficiente lx, cuya expresión es:
322
El valor de l está comprendido entre lx y ly, y presenta como
inconveniente su gran sensibilidad a la presencia de totales marginales
desequilibrados. Si l se aproxima a uno existe asociación entre X e Y, y si se
aproxima a cero existirá independencia.
323
4.13 FUNCIONES DE EXCEL PARA CORRELACIÓN Y
REGRESIÓN SIMPLE
Excel dispone de varias funciones que permiten trabajar con
coeficientes de correlación, regresión y otros conceptos sobre variables
multidimensionales. Ya sabemos que para ver las funciones de la categoría
324
325
Figura 4-1 Figura 4-2
326
327
Figura 4-3 Figura 4-4
A continuación, se presenta una relación de funciones de Excel
para correlación, regresión y variables multidimensionales, acompañada de un
ejemplo referido a las variables X e Y de la hoja de cálculo de la Figura 4-4
cuyos valores ocupan los rangos A2 A11 y B2:B11.
Devuelve
COVAR(x;y)
COVAR(A2:A11;B2:B11)
Devuelve
328
COEF.DE.CORREL(x;y)
COEF.DE.CORREL(A2:A11;B2:B11)
Da el coe
COEFICIENTE.R2(y;x)
COEFICIENTE.R2(B2:B11;A2:A11)
Da la pen
PENDIENTE(y;x)
PENDIENTE(B2:B11;A2:A11)
INTERSECCION.EJE(y;x) Da la orde
INTERSECCION.EJE(B2:B11;A2:A11)
PRONOSTICO(z;y;x) Halla la p
PRONOSTICO(2;B2:B11;A2:A11) variable in
TENDENCIA(y;x;z;constante) Halla las
TENDENCIA(A2:A8;B2:B8;B9:B11) para los v
Constante
especifica
CRECIMIENTO(y;x;z;constante) Halla las
CRECIMIENTO(A2:A8;B2:B8;B9: B11;0) para los v
Constante
especifica
Devuelve
329
ERROR.TIPICO.XY(y;x) error típic
ERROR.TIPICO(B2:B11;A2:A11) para un va
Figura 4-5
330
Figura 4-6
331
Figura 4-7
332
Figura 4-8
333
Figura 4-9
334
Figura 4-10
335
a) Justificar si puede aceptarse una dependencia estadística lineal entre R y H.
b) En caso positivo, hallar la recta de ajuste y representar la nube de puntos
ajustada.
336
Figura 4-11
Figura 4-12
337
Con vistas a realizar un ajuste entre ambas variables, lo lógico es
que el número de personas que se van de vacaciones al extranjero dependa de
la renta personal, con lo que hemos de hallar la función lineal f tal que H=f(R),
es decir, tenemos que hallar la recta de regresión de H sobre R, cuya pendiente
ha resultado ser b=0,057 y cuya ordenada en el origen ha resultado ser
a=-17,34. Por lo tanto, la recta de regresión de H sobre R es H=-17,34+0,057R,
que nos define la relación lineal entre el número de personas que se van de
vacaciones al extranjero y su renta personal.
338
Figura 4-13
339
Figura 4-14
340
Figura 4-15
341
342
Figura 4-16 Figura 4-17
343
Figura 4-18
Como ejemplo adicional consideramos las variables Q
(producción en millones de unidades monetarias) y E (exportaciones en
milllones de unidades monetarias), cuyos valores durante cuatro años para un
determinado sector económico son los siguientes:
344
a) Si se estima que las producciones en los ejercicios 1988, 1999 y 2000 van a
ser de 640, 690 y 720 millones, respectivamente, y que las condiciones del
mercado internacional no van a variar, ¿cuál será el volumen de exportaciones
previsible para esos años?
345
Figura 4-19. Los resultados se presentan en la Figura 4-20, e indican que el
ajuste por regresión ha sido bueno, al ser el coeficiente de correlación muy
próximo a la unidad (0,9493) y el coeficiente de determinación superior al 90%.
346
predicciones según la línea de ajuste exponencial Q = bEx se han calculado
mediante la función matricial CREC M ENTO (Figura 4-22), y se han obtenido
previsiones de exportaciones de 576,5, 947,3 y 1 276,1 millones para los años
1998, 1999 y 2000, respectivamente (lógicamente mayores que para el caso de
la predicción lineal). Los valores aceptables de los coeficientes de correlación y
regresión y el valor bajo del error típico indican que las predicciones realizadas
pueden ser bastante fiables.
347
Figura 4-21 Figura 4-22
348
4.14 EXCEL Y LOS AJUSTES POR REGRESIÓN
POLINÓMICA, LOGARÍTMICA,
EXPONENCIAL Y POTENCIAL
Consideramos la serie de inversiones realizadas por una empresa
en 10 períodos consecutivos que se presenta en la Figura 4-23. Con la finalidad
de predecir correctamente la inversión empresaril futura, se trata de ajustar la
serie a una línea de tendencia cúbica, exponencial, potencial, logarítmica y de
media móvil de orden 2 para decidir finalmente cuál de los modelos ofrece
mejores prediciones.
349
Figura 4-23
350
Figura 4-24
351
352
Figura 4-25 Figura 4-26
353
354
Figura 4-27 Figura 4-28
355
356
Figura 4-29 Figura 4-30
357
358
Figura 4-31 Figura 4-32
359
360
Figura 4-33 Figura 4-34
361
4.15 EXCEL Y LA CORRELACIÓN MÚLTIPLE CON
HERRAMIENTAS DE ANÁLISIS
Excel proporciona herramientas de análisis para medir la relación
entre dos conjuntos de datos. El cálculo de la correlación devuelve la covarianza
de dos conjuntos de datos dividida por el producto de sus desviaciones estándar.
362
4.15.1 Correlación y m atriz de correlaciones
La opción Análisis de datos del grupo Análisis de la ficha Datos
(Figura 4-35) nos lleva al cuadro de diálogo Análisis de datos de la Figura 4-36.
Si en la lista Funciones para análisis elegimos Coeficiente de correlación, se
obtendrá el cuadro de diálogo de la Figura 4-37, que permite calcular la matriz
de correlaciones de las variables especificadas en el campo Rango de entrada.
363
Figura 4-35 Figura 4-36
364
Figura 4-37
365
correspondientes para la tabla de resultados.
Figura 4-38
366
4.15.2 Covarianza y m atriz de covarianzas
La opción Análisis de datos del grupo Análisis de la ficha Datos
(Figura 4-35) nos lleva al cuadro de diálogo Análisis de datos de la Figura 4-39.
Si en la lista Funciones para análisis elegimos Covarianza, se obtendrá el
cuadro de diálogo de la Figura 4-40, que permite calcular la matriz de
correlaciones de las variables del campo Rango de entrada.
Figura
4-39
367
Figura 4-40 Figura 4-41
368
por haga clic en el botón Filas o Columnas para indicar si los datos del rango de
entrada están organizados en filas o en columnas.
Si la primera fila del rango de entrada contiene rótulos, active la
casilla de verificación Rótulos en la primera fila. Si los rótulos están en la
primera columna del rango de entrada, active la casilla de verificación Rótulos
en la primera columna. Esta casilla de verificación estará desactivada si el rango
de entrada carece de rótulos. Excel generará los rótulos de datos
correspondientes para la tabla de resultados.
369
4.16 EXCEL Y LAS TABLAS DE CONTINGENCIA
MEDIANTE TABLAS DINÁMICAS
En Excel es posible construir tablas de contingencia a través de
las tablas dinámicas. Una tabla dinámica o informe de tabla dinámica es una
tabla interactiva que se puede utilizar para presentar tablas cruzadas y
distribuciones de frecuencias que resumen rápidamente grandes volúmenes de
datos. Podrán elegirse las variables de sus filas y columnas a medida para ver
diferentes resúmenes de los datos de origen. Las variables a tabular serán
dinámicas, es decir, a partir de un conjunto extenso de información previamente
almacenada de forma bruta en múltiples variables, se cruzarán entre sí las
variables que se desee, filtrando los datos y mostrando los detalles de las áreas
que consideremos de interés.
370
4.16.1 Excel y las tablas de contingencia para dos
variables cualitativas
La tabla siguiente muestra los datos relativos a los resultados de
una encuesta de opinión (favorable o desfavorable) sobre un determinado
acontecimiento, realizada a un conjunto de hombres y mujeres pertenecientes a
una determinada clase social y con una edad conocida.
371
372
Se trata de crear una tabla de contingencia que cruce las
variables cualitativas sexo y opinión. Posteriormente, se especificará la tabla de
contingencia anterior según los valores de la variable clase.
373
Figura 4-42 Figura
4-43
374
Figura 4-44
375
valor aquí (o a la zona Valores), se obtiene la tabla dinámica.
376
377
Figura 4-45
378
Figura 4-46
379
4.16.2 Excel y las tablas de contingencia para dos
variables, una cualitativa y otra
cuantitativa
Con los datos del ejemplo anterior, se trata ahora de obtener la
tabla de contingencia que cruza la variable cualitativa OPINION con la variable
cuantitativa EDAD. Ahora se trata de cruzar la OPINION con la EDAD para
tabular el número de personas que con las distintas edades tienen las diferentes
opiniones.
380
381
Figura 4-47
382
383
Figura 4-48 Figura 4-49
384
Figura 4-50
385
4.16.3 Excel y las tablas de contingencia para m ás
de dos variables
Con los datos del ejemplo anterior realizaremos una tabla de
contingencia tridimensional que cruce la variable EDAD (filas) con las variables
OPINIÓN y SEXO (columnas). Posteriormente, realizar una tabla de
contingencia que cruce la EDAD con OPINION y SEXO para la clase media.
386
Figura 4-51
387
pueden obtenerse tablas que crucen EDAD con OP NION y SEXO para cada
valor de CLASE haciendo clic en el triángulo situado en la parte inferior del
campo Todas (Figura 4-53). Por ejemplo, en la Figura 4-54 se cruza EDAD con
OPINION y SEXO para la clase media.
Figura 4-52
388
Figura 4-53
389
Figura 4-54
390
4.17 EXCEL Y LOS CONTRASTES DE ASOCIACIÓN E
INDEPENDENCIA
En Excel es muy sencillo calcular el cuadrado de la contingencia
c2 a partir de las frecuencias absolutas Oj de las propias celdas de la tabla de
contingencia y de las frecuencias esperadas Ej = (Total Columna)(Total
Fila)/(Total General). La expresión del estadístico c2 para contrastar la
independencia es:
391
estudiadas en este cap tulo.
392
Figura 4-55
393
Figura 4-56
Figura 4-57
394
A partir de los valores de la tabla de contingencia y de los valores
de la tabla de frecuencias esperadas, podemos calcular el valor del cuadrado de
395
Figura 4-58 Figura 4-59
396
397
Figura 4-60 Figura 4-61
Figura 4-62
398
Figura 4-63
399
Figura 4-64
400
Figura 4-65
401
F2 = c 2/N = =0,030789
=0,172827
=0,175468
402
= 0,175468 donde m = min(h-1,k-1)=1
=-0,44444
EJERCICIOS RESUELTOS
Ejercicio 1. Se han estudiado los pesos en kg y las tallas en cm de 70 individuos
obteniéndose los datos de la tabla siguiente:
403
1. Hallar el peso medio y la talla media así como el error cometido al
resumir pesos y tallas por sus valores medios ¿Qué media es mejor?
2. Hallar la distribución según las tallas de los individuos que pesan 54 kilos
y la distribución según los pesos de los individuos que miden entre 161
cm y 167 cm. Hallar media y varianza de las dos distribuciones
condicionadas.
48 3 2 2 1
51 2 3 4 2
54 1 3 6 8
57 0 0 1 2
404
60 0 0 0 2
n.j 6 8 13 15
n.jyj 960 1296 2132 2490
Figura 4-66
X ni. Y
405
48 8 160
51 14 162
54 24 164
57 14 166
60 10 168
170
Tenemos lo siguiente:
406
Se observa que el menor coeficiente de variación es el relativo a la talla
media, que resulta ser así un promedio más adecuado.
48 5 160
51 9 162
54 17 164
57 3 166
60 2 168
170
407
Figura 4-67
408
Ejercicio 2. Se considera la variable bidimensional (X,Y) cuya distribución de
frecuencias se presenta en la tabla siguiente:
409
Para estudiar la independencia de las dos variables utilizando la
distribución conjunta y las marginales tenemos que comprobar que fij = fi.f.j "i,j.
La primera tarea será construir una tabla con la distribución conjunta (fij
= nij/N) y con las marginales (fi.= ni./N y f.j = n.j/N) como se indica en la
Figura 4-68.
X/Y 15 24
12 3 4
15 6 8
19 9 12
n.j 18 24
fij
0,03571429 0,04761905
0,07142857 0,0952381
0,10714286 0,14285714
f.j 0,21428571 0,28571429
Figura 4-68
0,21428*0,16666 0,28571*0,16666
0,21428*0,33333 0,28571*0,33333
0,21428*0,5 0,28571*0,5
410
Observamos que, una vez realizados estos cálculos, se obtiene la
tabla de la distribución conjunta fij.
0,071428571 0,0952381
0,107142857 0,14285714
0,214285714 0,28571429
411
412
Figura 4-69
Figura 4-70
413
fj/i=3 9/42 12/42 6/42
f.j 18/84 24/84 12/84
Figura 4-71
414
6/18 8/24 4/12
Figura 4-72
Observamos que se cumple fi/j = fi. "i,j ya que:
415
marginales X e Y, que se calcularán con los datos de la tabla de la Figura 4-73
X/Y 15 24
12 3 4
15 6 8
19 9 12
n.j 18 24
Figura 4-73
Figura 4-74
416
La covarianza, que será cero debido a la independencia, puede calcularse
como sigue:
417
12 3 4 2 5 14 540 1
15 6 8 4 10 28 1350 28
19 9 12 6 15 42 2565 54
n.j 18 24 12 30 84 4455 95
Figura 4-75
418
1. ¿Es simétrica la distribución del número de días de baja de los
trabadores?
2. ¿Cuál es la edad más frecuente de los trabajadores que piden la baja?
3. Ajustar mediante un modelo exponencial los días de baja en función de la
edad.
4. Realizar el mismo ajuste considerando un modelo lineal.
5. ¿Cuál de los ajustes es el mejor?
X/Y 10 30 50 ni.
24 28 2 0
35 26 15 4
45 6 14 5
n.j 60 31 9
yjn.j 600 930 450
419
yj3n.j 60000 837000 1125000
N.j 60 91 100
Figura 4-76
420
Para estudiar la asimetría del número de días de baja de los trabajadores
calculamos el coeficiente de asimetría de Fisher de la variable marginal Y como
sigue:
421
Se observa que hay una ligera asimetría hacia la derecha, pero
muy pequeña. Los días de baja se distribuyen casi simétricamente a lo largo del
año.
años
422
24 28 2 0 30
35 26 15 4 45
45 6 14 5 25
n.j 60 31 9 100
z jn. j 60 45,790 15,291 121,0811
Figura 4-77
423
El parámetro Log(a) se estima por mínimos cuadrados mediante:
424
El ajuste no es de calidad porque R2 está más cerca de cero que
de la unidad.
425
Para realizar el cálculo de
se utiliza la tabla siguiente:
24 28 2 0 30 6720
35 26 15 4 45 9100
45 6 14 5 25 2700
n.j 60 31 9 100 18520
426
Figura 4-78
427
Para realizar los cálculos necesarios elaboramos la tabla
siguiente:
X/Y 2 5 9 10
3 0 2 1 2
4 2 1 0 3
6 3 0 4 2
n.j 5 3 5 7
yjn.j 10 15 45 70
428
Figura 4-79
429
Las distribuciones condicionadas de Y a todos los valores de X, así como
los cálculos requeridos se presentan a continuación:
2 0 0 2 2 4 2 3
5 2 10 5 1 5 5 0
9 1 9 9 0 0 9 4
10 2 20 10 3 30 10 2
5 39 6 39 9
430
Se observa que se cumple:
3 3 9 27
4 1 4 16
6 4 24 144
8 37 187
431
La recta de regresión de X sobre Y tiene como ecuación
3 0 2 1 2 5 0
4 2 1 0 3 6 16
6 3 0 4 2 9 36
n.j 5 3 5 7 20 52
Figura 4-80
432
La recta de regresión de X sobre Y tiene como ecuación
C 15 25 35 45
RM
30 10 15
40 5 20 25
50 15 5 5
433
a) Ajustar los datos a una relación lineal adecuada entre el consumo y la renta.
b) Medir el grado de representatividad de la relación lineal anterior.
c) Calcular el consumo esperado para una renta de 60*104 unidades monetarias.
d) Obtener las distribuciones marginales de las variables C y RM y sus medias,
varianzas, desviaciones típicas y coeficientes de asimetría y curtosis.
Una vez introducidos los datos de las variables, utilizamos las funciones
de Excel que permiten calcular el coeficiente de correlación y la pendiente y
ordenada en el origen de la recta de regresión de C sobre RM (Figura 4-81). La
Figura 4-82 presenta los resultados.
434
Figura 4-81
Figura 4-82
435
No obstante, correlación débil no implica independencia, por lo
que puede hallarse la recta de regresión de C sobre RM, pero con la precaución
de que dicha relación lineal entre ambas variables puede no ser buena, y sobre
todo pueden no ser fiables las predicciones basadas en dicha relación de
linealidad. Una vez calculadas la pendiente y la ordenada en el origen de la recta
de regresión, tenemos la relación C=7,5+0,5RM.
Figura 4-83
436
Para hallar las medias, varianzas, desviaciones típicas y coeficientes de
variación, asimetría y curtosis de las distribuciones marginales de C y RM,
seleccionamos la opción Análisis de datos del menú Herramientas, y elegimos
Estadística descriptiva en Funciones para análisis (Figura 4-84). Rellenamos la
pantalla Estadística descriptiva como se indica en la Figura 4-85. Al pulsar
Aceptar, se obtienen los resultados de la Figura 4-86.
437
Figura 4-84 Figura 4-85
438
Figura 4-86
Para hallar las propias distribuciones marginales de C y RM,
seleccionamos la opción Análisis de datos en el grupo Análisis de la ficha Datos,
y elegimos Histograma en Funciones para análisis (Figura 4-87). Rellenamos la
pantalla Histograma como se indica en la Figura 4-88. Al pulsar Aceptar, se
obtiene la distribución e histograma de RM. Repitiendo el proceso para C
(Figura 4-89), se obtiene la marginal de C. Los resultados se observan en la
Figura 4-90.
439
Figura 4-87
440
441
Figura 4-88 Figura 4-89
442
Figura 4-90
Ejercicio 6. Consideramos la distribución bidimensional de las variables presión
(P) y tiempo de aplicación de dicha presión (T) sobre determinadas piezas para
el control de su calidad de fabricación.
T 0 5 10 15 20
443
P
66 1 1 0 1 2
68 3 2 1 0 1
70 0 1 9 1 2
72 1 2 1 2 1
74 3 1 2 1 2
444
Figura 4-91
tal y como se indica en la Figura 4-92 (basta hacer clic en y hacer doble
clic en la función).
445
Figura 4-92
446
Figura 4-93
447
Figura 4-94 Figura 4-95
448
449
Figura 4-96
450
Insertar. La pantalla de diseño se rellena llevando la variable P a F LA, y la
variable T a COLUMNA y a VALORES, y utilizando la función CUENTA como
función de resumen. Al pulsar Aceptar, se obtiene la Figura 4-99, cuyas
columnas son distribuciones de P condicionadas al valor de T que encabeza la
columna (la tercera columna presenta la condicionada de P a T=10).
451
Para hallar la distribuciones condicionadas de T a todos los
valores de P, utilizamos la opción Informes de tabla y gráfico dinámico del menú
Datos, rellenando la pantalla de diseño llevando la variable T a FILA y la variable
P a COLUMNA y a VALORES, y utilizando la función CUENTA como función de
resumen. Al pulsar Aceptar, se obtiene la Figura 4-100, cuyas columnas son
distribuciones de T condicionadas al valor de P que encabeza la columna (la
cuarta columna presenta la condicionada de T a P=72).
Figura 4-101
452
Figura 4-102
453
Figura 4-103
454
Figura 4-104
1. Ajustar los datos anteriores a un modelo lineal que explique los ahorros
familiares en función de los ingresos para la región dada.
455
2. Ajustar los datos anteriores a un modelo lineal parabólico que explique
los ahorros familiares en función de los ingresos para la región dada.
3. ¿Qué ajuste es mejor?
4. ¿Qué ahorro se puede prever para una familia de la región que ingrese
2500 euros mensuales?
Si yi Siyi yi 2 Si
456
Figura 4-105
457
Luego el modelo lineal ajustado será:
458
La solución de este sistema ofrece los parámetros del modelo parabólico
(b0=85,713, b1= -7,962 y b2 = 0,189). Luego el modelo ajustado será:
459
La tabla siguiente ordena los cálculos para hallar
Si yi (Si-(85,713-7,962yi+0,189
1,9 20,5
1,8 20,8
2 21,2
2,1 21,7
1,9 22,1
2 22,3
2,2 22,2
2,3 22,6
2,7 23,1
3 23,5
460
Figura 4-106
461
donde y es el porcentaje de personas con una renta igual o inferior a x siendo x0
la renta mínima y b un parámetro estructural. Se pide ajustar una ley de Pareto a
los datos siguientes:
462
Luego el modelo lineal ajustado será:
4 1
463
Para medir la calidad del ajuste lineal utilizamos el coeficiente de
correlación, o su cuadrado, el coeficiente de determinación, que se calcula como
sigue:
Figura 4-107
464
de determinación es alto (el coeficiente de correlación vale
465
Se trata de un ajuste de tipo potencial. Todo este tipo de ajustes se
resuelve aplicando logaritmos para linealizar de la siguiente forma:
Ki yi Zi = log(yi) xi
466
0,8 3,4 0,53147892
1 4,1 0,61278386
1,4 6 0,77815125
SUMAS → 11,213708
467
Figura 4-108
Para medir la calidad del ajuste potencial medimos la del ajuste
lineal al que es equivalente utilizando el coeficiente de correlación, o su
cuadrado, el coeficiente de determinación, que se calcula como sigue:
468
, que es un valor muy próximo a 1 indicativo del
alto grado de relación entre Zi y xi, y por tanto entre xi e yi).
469
Figura 4-109
470
Figura 4-110
471
Figura 4-111
472
Figura 4-112 Figura 4-113
473
Figura 4-114
474
Figura 4-115 Figura 4-116
475
Figura 4-117
476
pronóstico y presentar la tabla de contingencia correspondiente.
b) Hallar las distribuciones marginales del atributo profesión y del atributo
pronóstico y realizar un diagrama de barras para el atributo F.
c) Hallar la distribución de la profesión condicionada al valor igual del atributo
pronóstico.
d) ¿Existe relación entre los pronósticos sobre la evolución del mercado bursátil
y la profesión del encuestado?
Figura 4-118
La siguiente tarea será introducir los datos de los dos atributos como
dos variables en la hoja de cálculo. Denominamos P a la variable pronóstico, y F
a la variable profesión. P puede tomar los valores B (baja), I (igual) y S (sube). F
puede tomar los valores E (economista), I (Ingeniero) y A (abogado). El valor EB
de la variable bidimensional lo introducimos 20 veces (la E en la columna de la
varible F y la B en la columna de la variable P), el valor EI 20 veces, el valor ES
10 veces, el valor IB 10 veces, el valor II 20 veces, el valor IS 18 veces, el valor
AB 5 veces, y el valor AS 5 veces.
477
contingencia de la Figura 4-119.
Figura 4-119
478
Figura 4-120 Figura 4-121
479
Figura 4-122
480
La distribución de la Profesión condicionada al valor Igual del atributo
Pronóstico, está formada por la zona en negrita de la figura 5-123. Para ver si
existe relación entre los atributos Pronóstico y Profesión, calculamos medidas
de asociación y realizamos el contraste de independencia de la chi-cuadrado
según las fórmulas de la Figura 4-124. Se obtienen los resultados de la Figura
4-125.
Figura 4-123
481
Figura 4-124
482
Figura 4-125
Se observa que el p-valor del contraste de la chi-cuadrado es menor que
0,05, lo que indica que las variables no son independientes. Además, el valor del
estadístico de la chi-cuadrado es superior al valor crítico al 95%, lo que
corrobora la dependencia de las variables.
483
asociación entre las variables.
484
Capítulo 5
485
5.1 NÚMEROS ÍNDICES SIMPLES
En los capítulos anteriores se han caracterizado las distribuciones
de una y varias variables por una serie de medidas que intentaban sintetizar el
conjunto de toda la información disponible (medidas de posición), pasando
después al estudio de la variabilidad (medidas de dispersión) y de las medidas de
forma (asimetría y curtosis). El problema que ahora se nos presenta es la
comparación de magnitudes simples o complejas referidas a una situación
inicial, que se fijará previamente de la forma más adecuada posible a los
objetivos que se persigan y que condiciona la comparación. En cuanto a las
magnitudes complejas, habrá que tener en cuenta la homogeneidad de las
unidades y el problema de la agregación. También se estudiará en este capítulo
la deflactación de series estadísticas y los índices o medidas de concentración.
Sea Xi una magnitud simple y sean xi0 y xit los valores de dicha magnitud
en los períodos base y actual respectivamente. El número índice simple Ii para la
magnitud citada se define como:
que mide la variación en tanto por uno que ha sufrido la magnitud Xi entre los
dos períodos considerados. Generalmente, estos índices se suelen expresar en
porcentajes, multiplicándolos por cien.
486
Entre los números índices simples más usuales tenemos los índices de
precios, los índices de cantidades, de producción o cuánticos, y los índices de
valor. Un índice simple de precios, o precio relativo, es la razón entre el precio de
un bien en el período actual pit y el precio del mismo en el período base pio. Se
puede escribir:
487
5.2 NÚMEROS ÍNDICES COMPLEJOS NO
PONDERADOS
En la práctica, los números índices simples no suelen utilizarse
aisladamente. Por lo general, no estamos interesados en comparar precios,
cantidades o valores de bienes individuales, sino en comparar dichas magnitudes
para grandes grupos de bienes. Como consecuencia de ello, la información
suministrada por los índices simples de cada uno de los diferentes bienes debe
ser resumida en un único índice al que vamos a denominar complejo.
Un índice complejo ha de ser sencillo, pero a la vez ha de reunir la
mayor cantidad posible de información. Así, podemos considerar dos tipos de
índices complejos, en los que va a primar, en mayor o menor medida, cada una de
las características anteriores. Si se prefiere sencillez, tendremos los índices
complejos no ponderados, y si, por el contrario, lo que se desea es que
contengan la mayor cantidad de información posible, se utilizarán los índices
complejos ponderados.
Sea la magnitud compleja X formada por las magnitudes simples X1, X2,
..., Xi, ..., XN que toman los siguientes valores:
488
xi0 xit Ii = xit / xi0
. . .
. . .
xN0 xNt IN = xNt / xN0
489
Índice media agregativa
Este tipo de índice considera, en vez de las medias entre los diferentes
índices simples, la relación por cociente entre las sumas de los diferentes
valores de la magnitud en los dos períodos. Su expresión es:
490
5.3 NÚMEROS ÍNDICES COMPLEJOS DE PRECIOS NO
PONDERADOS
En los epígrafes siguientes se tratan los índices complejos de
precios no ponderados más habituales. Estos indices van a tener la ventaja de su
sencillez de cálculo, pero tienen la desventaja de no tener en cuenta la
importancia relativa de cada uno de los diferentes bienes en el conjunto total, ya
que no son ponderados. También es una desventaja el hecho de que las unidades
utilizadas para medir los precios de cada bien afectan al valor de los índices, con
lo que estos no resultan homogéneos.
Índice de Sauerbeck
Índice de Bradstreet-Dûtot
491
492
5.4 NÚMEROS ÍNDICES COMPLEJOS PONDERADOS
Los números índices complejos ponderados tienen en cuenta la
diferente importancia relativa de cada una de las magnitudes simples dentro del
conjunto de todas ellas. Para ello, es necesario afectar a cada magnitud simple, y
por tanto a sus índices, de unas ponderaciones que midan su peso relativo dentro
del conjunto en que se consideren.
493
El índice complejo ponderado media armónica resume los diferentes
índices simples Ii considerando su media armónica ponderada, con lo que su
expresión será:
Este tipo de índice considera, en vez de las medias ponderadas entre los
diferentes índices simples, la relación por cociente entre las sumas de los
diferentes valores ponderados de la magnitud en los dos períodos. Su expresión
es:
494
495
5.5 NÚMEROS ÍNDICES COMPLEJOS DE PRECIOS
PONDERADOS
En el trabajo con los índices complejos de precios ponderados es
fundamental el tipo de ponderaciones utilizado. Entre los sistemas de
ponderaciones propuestos tradicionalmente, tenemos:
Índice de Laspeyres
496
Índice de Paasche
Índice de Edgeworth
497
Es una media agregativa ponderada de precios cuyo coeficiente de
ponderación es wi=qi0+qit. Su expresión será:
498
5.6 NÚMEROS ÍNDICES COMPLEJOS PONDERADOS
CUÁNTICOS O DE PRODUCCIÓN
La evolución de las magnitudes también puede estudiarse a través
de sus cantidades físicas. Los números índices cuánticos o de producción tienen
como objetivo estudiar las variaciones habidas en la producción física de un
conjunto de bienes y servicios, para medir su evolución en el tiempo. Los más
importantes se ven en los epígrafes siguientes.
499
Índice ideal de Fisher
500
5.7 PROPIEDADES DE LOS NÚMEROS ÍNDICES
Existen determinadas propiedades que serían deseables para todo
número índice. Las más importantes son las siguientes:
501
las unidades de medida.
502
5.8 ÍNDICES EN CADENA
Los índices en cadena son une serie de índices en los que la base es
siempre el período precedente, con lo que cada uno de ellos ofrece una
comparación porcentual respecto al período anterior. A través de este
procedimiento, y partiendo de una serie de enlaces relativos, podemos conseguir
una serie de índices referidos a una base común aplicando la propiedad circular.
La nueva serie obtenida nos permitirá efectuar comparaciones a medio y largo
plazo.
I0,1*I1,2*It-1,t = I0,t
503
5.9 CAMBIO DE BASE Y ENLACES DE NÚMEROS
ÍNDICES
A medida que pasa el tiempo, mantener el período base de un
índice puede resultar inadecuado. Existe pérdida de representatividad de los
índices al irnos alejando del período base, sobre todo cuando para ponderar
magnitudes actuales se utilizan pesos relativos referidos al período base. Este
problema se resuelve haciendo un cambio de base a un período más cercano al
actual. Para poder relacionar series de índices referidos a distintos períodos
base, se utilizan los enlaces técnicos entre ambas series. Para efectuar el
cambio de base nos basaremos en la propiedad de inversión de los números
índices.
0 I00 I0h
1 I10 I1h
. . .
. . .
i Ii0 Iih
. . .
. . .
h Ih0 Ihh
. . .
. . .
t It0 Ith
504
Iih = Ii0/Ih0 * Ihh = Ii0 / Ih0
donde Ih0 es el índice que hace de enlace técnico entre las dos series.
505
5.10 DEFLACTACIÓN DE SERIES ESTADÍSTICAS
506
5.11 PARTICIPACIÓN Y REPERCUSIÓN
Supongamos que todas las magnitudes simples que componen un
índice complejo sufren una variación que podemos expresar por Dp1t, Dp2t,..,
DpNt. El índice presentará una variación total debida a todas estas variaciones, y
cada una de sus componentes contribuirá con una variación particular,
denominada repercusión, a la variación del índice general. La suma de todas las
repercusiones individuales de cada componente es igual a la variación total del
índice general.
donde
507
La variación en porcentaje del índice general se expresa como:
508
La participación en porcentaje de la componente i en la variación del
índice general será la relación por cociente entre la repercusión en porcentaje y
la suma de repercusiones en porcentaje de todas las componentes, expresada en
tanto por ciento. Su expresión será:
509
5.12 ÍNDICES OFICIALES
Índice de precios al consumo
510
para cantidades.
El índice de precios industriales ( PRI) es un indicador que mide la
evolución de los precios en el primer paso de comercialización de los productos,
es decir, en la fase de venta de éstos a los precios de producción, esto es, sin
incluir los impuestos indirectos que los gravan. Se refiere únicamente a
productos industriales de producción nacional, con exclusión de los servicios,
tales como instalaciones, transportes, comercialización, reparaciones, etc.
Índices de salarios
Reflejan las variaciones del salario total de los trabajadores por unidad de
tiempo. Suelen ser del tipo media aritmética ponderada, recogiendo la variación
de la relación por cociente entre las remuneraciones en el período base y el
actual.
511
del saldo comercial de cada sector. Si llamamos Xi y M i a las exportaciones
e importaciones del sector i, sus expresiones son:
512
Índice de comercio intraindustrial: Se utiliza cuando en los diferentes
sectores se produce simultáneamente la exportación e importación de un
mismo tipo de productos. Su expresión es:
513
Índices de competitividad: Se utilizan para medir la competitividad de las
economías, y se basan en la evolución de los precios y los tipos de cambio.
Los más importantes son el tipo de cambio efectivo nominal (TCEN), que
se utiliza para medir la evolución de una moneda en un período determinado
(marcado por el año 0 que es el base y el año t que es en el que se realiza
el cálculo) frente a un conjunto de monedas correspondientes a una
agrupación de países con los que mantiene intercambios, y el tipo de
cambio efectivo real (TCER), que es un ajuste del anterior introduciendo
un factor que refleja las variaciones de precios relativos entre el país que
elabora el índice y los demás a lo largo de un período determinado. Sus
expresiones son las siguientes:
514
el total de exportaciones españolas destinadas al conjunto de países en
cuestión, y M el total de importaciones españolas procedentes del conjunto
de países. Ci0 y Cit representan las cotizaciones oficiales de la peseta
frente a la moneda del país i en el año base y en el año t respectivamente. Pt
y P0 son los índices de precios de España en los instantes base, y t, y Pi0 y
Pit son los índices de precios del país i en el año base y en el año t.
Indicadores de la coyuntura
515
5.13 TASAS DE VARIACIÓN
Expresan el porcentaje que representa la variación absoluta de
una magnitud, en un intervalo temporal determinado, sobre el valor inicial de
dicha magnitud, que normalmente se corresponde con el del año anterior. Esto
es:
516
517
5.14 MEDIDAS DE CONCENTRACIÓN
Las medidas de concentración tratan de poner de relieve el mayor o menor
grado de igualdad en el reparto del total de los valores de una variable. Son, por
tanto, indicadores del grado de equidistribución de la variable. Estos indicadores
no deben confundirse con las medidas de dispersión, ya que desde el punto de
vista estadístico la dispersión hace referencia a la variabilidad de los datos, a las
diferencias que entre ellos existen y, por tanto, a la mayor o menor
representatividad de los promedios.
518
5.15 ÍNDICE DE CONCENTRACIÓN DE GINI
Los productos xi*ni, que nos indicarán la renta total percibida por los ni
rentistas de renta individual xi.
Una medida que expresa cada ui en tantos por ciento de un. A este
porcentaje le llamamos qi. Tendremos que qi = (ui/un) *100.
519
Sabemos que si la concentración es mínima, es decir, si la renta está
repartida por igual, pi = qi, con lo que IG =0. En el caso de concentración
máxima, solamente el último trabajador percibe renta, por lo que, q1 = q2 = ... =
qn-1 = 0, con lo que IG =1. El campo de variación de IG va, pues, de cero a uno, y
su valor responderá a una distribución tanto más justa de la renta o del salario
cuanto más próximo esté a cero.
520
5.16 CURVA DE CONCENTRACIÓN DE LORENTZ
La distribución de salarios, o de rentas, se puede materializar
gráficamente, obteniéndose la llamada curva de concentración o curva de
Lorentz. Para construirla, dibujamos un cuadrado cuyos lados están divididos en
una escala de 1 a 100. En el vértice inferior izquierdo está el origen de
coordenadas, en el eje de abscisas representamos los valores pi, y en el de
ordenadas los valores qi. A continuación, representamos los puntos (pi,qi), que,
al unirlos entre sí, nos determinan una poligonal llamada curva de Lorentz.
PROBLEMAS RESUELTOS
Ejercicio 1. La evolución de las ganancias de una empresa del ramo del
automóvil desde el año 1950 hasta 1960 se presenta en la tabla siguiente:
521
Año Ganancias Índices simples
1950 g0 100
1951 g1 (g1/g0)*100
1952 g2 (g2/g0)*100
1953 g3 (g3/g0)*100
1954 g4 (g4/g0)*100
1955 g5 (g5/g0)*100
1956 g6 (g6/g0)*100
1957 g7 (g7/g0)*100
1958 g8 (g8/g0)*100
1959 g9 (g9/g0)*100
1950 12 100
1951 14 116,6666667
1952 18 150
1953 18 150
1954 19 158,3333333
1955 15 125
522
1956 12 100
1957 16 133,3333333
1958 20 166,6666667
1959 24 200
1960 35 291,6666667
0 0 ( 0/Ii)*
1 I1 (I1/Ii)*
2 I2 (I2/Ii)*
3 I3 (I3/Ii)*
4 I4 (I4/Ii)*
5 I5 (I5/Ii)*
6 6 ( 6/Ii)*
7 I7 (I7/Ii)*
8 I8 (I8/Ii)*
9 I9 (I9/Ii)*
10 I10 (I10/Ii)*
523
Una vez realizados los cálculos de la tabla anterior tenemos los
siguientes resultados para los índices simples en base 1960:
Índices simples
Año Ganancias
en base 1950
1950 12 100
1951 14 116,6666667
1952 18 150
1953 18 150
1954 19 158,3333333
1955 15 125
1956 12 100
1957 16 133,3333333
1958 20 166,6666667
1959 24 200
1960 35 291,6666667
524
Por las propiedades de los índices podemos hacer lo siguiente:
Como la base en 1953 es 100 y el índice de valor en 1960 es 96, dicho índice de
valor ha disminuido en un 4%.
525
Artículo A Artículo B Artículo C
Años
Precio Cantidad Precio Cantidad Precio
Cantidad
1980 2 10 5 12
10 3
1981 2 12 6 10
11 2
1982 3 15 6 5
12 3
1983 4 20 7 6
12 1
1984 4 18 8 5
13 2
526
Para hallar el índice de precios de Laspeyres en el año 1981 con
base en 1980 (Lp81,80) es necesario hallar å(P81*Q80)/å (P80*Q80)*100. De la
misma forma se calculan los índices de precios de Laspeyres en los años 1982,
1983 y 1984 con base en 1980 (Lp82,80; Lp83,80 y Lp84,80) usando las
expresiones: å(P82*Q80)/å(P80*Q80)*100, å(P83*Q80)/å(P80*Q80)*100 y
å(P84*Q80)/å(P80*Q80)*100.
527
Figura 5-1
Figura 5-2
528
Figura 5-3
Figura 5-4
529
La Figura 5-5 muestra las fórmulas, y la Figura 5-6, los
resultados.
Figura 5-5
Figura 5-6
530
Ejercicio 5. Con los datos del producto interior bruto a precios de mercado
(P Bpm) y del deflactor implícito del P Bpm (D Ppm) de la economía española
recogidos en el cuadro presentado a continuación:
PIBpm D Ppm
P Bpm DIPpm
Años corriente Base 1980 Años corriente
Base 1980
531
3. Hallar índices con base 1974 de la serie P Bpm en pesetas constantes del
año 1980.
4. Hallar P B a precios del mercado en pesetas constantes del año 1986
para 1970-1992.
Los datos así obtenidos expresan cuál fue la producción de cada año
valorada a precios del año 1980 (Figura 5-8). Así pues, cualquier variación en
los elementos de la serie obtenida será producto de modificaciones sólo en las
cantidades producidas, y no en los precios.
532
533
Figura 5-7 Figura 5-8
534
de modo generalizado, excepto en el año 1981.
535
Figura 5-9 Figura 5-10
536
Para calcular los números índices con base en el año 1974 de la
serie TVPIBpmK80 creamos la columna Ind74 mediante la expresión
(P BpmK80/13715,1)*100, donde 13715,1 es el valor del PIBpm de 1974 en
pesetas constantes de 1980 (Figura 5-11). Se obtiene la nueva serie Ind74, que
contempla la serie de números índices pedidos (Figura 5-12).
Figura 5-11
537
Figura 5-12
Para hallar la serie del PIBpm a precios constantes del año 1986,
necesitamos los datos del deflactor del P B en base 1986. Como el enunciado
538
nos proporciona la serie del deflactor en base 1980, será necesario realizar el
cambio de base. Para ello, creamos la columna llamada D Ppm86 con la
expresión (DIPpm80/192,2)*100 (Figura 5-13), donde192,2 es el deflactor
implícito del PIBpm de 1986 en base 1980. Se obtiene la nueva serie DIPpm86
con los datos del deflactor del PIBpm en base 1986 (Figura 5-14).
539
Figura 5-13
540
Figura 5-14
541
Ahora ya podemos hallar la serie del P Bpm a precios constantes
de 1986. Para ello creamos la columna de nombre P BpmK86 con la expresión
(P BpmC/DIPpm86)*100 (Figura 5-15) para obtener los datos de la Figura 5-16.
542
543
Figura 5-15
544
545
Figura 5-16
Ejercicio 6. Una fábrica de automóviles produce cuatro modelos, cuyos precios
de venta, costes de materiales empleados y números de unidades producidas en
los últimos tres años fueron los siguientes:
_________1985_______ _________1986________
_________1987________
Modelos Precio Nº de Precio Nº de Precio
Nº de
venta Coste unidades venta Coste unidades venta
Coste unidades
546
Para calcularlo construiremos una tabla con variables (columnas)
que reflejan los precios de venta, costes y cantidades para los cuatro modelos de
automóviles. Para calcular el índice de producción de Laspeyres en el año 1986
con base en 1985 usamos la expresión definida como Lq86,85 = å(Q86*(P85 -
C85)) /SUM(Q85*(P85 - C85))*100. Se obtiene el valor 93,3. De la misma forma
se calcula el índice de producción de Laspeyres en el año 1987 con base en
1985, utilizando la expresión Lq87,85 = å(Q87*(P85 - C85))/SUM(Q85*(P85 -
C85))*100, para obtener el valor 102,1. La Figura 5-17 muestra las fórmulas y la
Figura 5-18 los resultados.
Figura 5-17
547
Figura 5-18
548
Figura 5-19
Figura 5-20
549
El índice de precios de Laspeyres se calcula mediante la siguiente
expresión:
550
Figura 5-21 Figura 5-22
1979 1988
Productos
Precio Cantidad Precio
Cantidad
En este problema suponemos que los precios que nos dan representan
también el valor añadido de cada producto, que es tanto como decir que el coste
de las materias primas empleadas es cero. Pueden asimilarse a este caso, en
551
parte, las industrias integrales y las industrias de la primera fase del proceso
productivo.
Figura 5-23
552
Figura 5-24
553
287,477,0 114,6
Portugal 98,96 71,93 410,428,3
263,276,2 190,6
Dinamarca 16,10 16,24 54,288,1
75,441,8 124,1
Irlanda 180,53 167,31 21,658,3
74,245,1 121,4
Grecia 123,43 5 7,09 47,621,1
24,182,1 265,9
554
Para hallar el TCEN basta con hacer el producto de los elementos
de la columna TCENt y multiplicar por 100; es decir, elevaremos a la potencia 10
la media geométrica de la variable TCENt y multiplicaremos por 100. La Figura
5-25 muestra las fórmulas, y la Figura 5-26, los resultados.
Figura 5-25
555
Figura 5-26
España 1989
UE 1989
Sector
X M X M
556
16380 11633
3. Materias primas 1634 4824
31401 65480
4. Productos energéticos 1906 7148
34794 86508
5. Aceites y grasas 383 217
4002 4266
6. Productos químicos 3902 6307
124782 108157
7. Productos manufacturados 9001 8178
197244 194880
8. Maquinaria y material de transporte 15230 24.112
393977 348614
9. Artículos diversos 4514 5996
127949 130465
Total 42680 62941
1018349 1047228
557
Para resolver este problema comenzamos construyendo una tabla
con los datos en las columnas XE (exportaciones españolas), ME (importaciones
españolas), XUE (exportaciones de la Unión Europea), y MUE (importaciones de
la Unión Europea). Para hallar el saldo comercial relativo, creamos la columna
llamada SCR con la expresión (XE-ME)/(XE+ME)*100. Sectores con SCR
positivo indican que el país presenta ventaja comparativa para el sector en
cuestión.
558
El índice de comercio intraindustrial se utiliza cuando en los
diferentes sectores se produce simultáneamente la exportación e importación de
un mismo tipo de productos. Su expresión es:
559
Para hallar el índice de especialización, que ya es un indicador de
comparación de la estructura comercial española con la de la Unión Europea,
creamos la columna llamada E mediante la fórmula ((XE/å(XE))/(XUE/
å(XUE)))*100. Para sectores con IE superior a 100, sus exportaciones tienen
una representación mayor en España que en el conjunto de la Unión Europea.
La Figura 7-27 muestra todas las fórmulas para la generación de todas las
series utilizas durante el problema, y la Figura 7-28 presenta los resultados, en
los que pueden analizarse los comentarios realizados a lo largo del problema.
560
Figura 7-27
561
Figura 7-28
562
4. Menaje 100 74,1
131,5
5. Servicios médicos y sanitarios 100
23,9 123,8
6. Transportes y comunicaciones 100 143,8
121,3
7. Esparcimiento, enseñanza y cultura 100 69,6
129,6
8. Otros bienes y servicios 100
85,2 137,9
563
presenta las fórmulas, y la Figura 7-30 presenta los resultados.
Figura 7-29
Figura 7-30
Ejercicio 11. Hallar el índice bursátil para 1986, con base 1980=100, de la
564
siguiente cartera de valores (volumen de negocio en 109 pesetas):
1980 1986
565
Figura 7-31 Figura 7-32
El resultado nos indica que desde el año 1980 al año 1986, el valor de la
cartera de valores aumentó en un 238,175 por ciento.
Fábrica A Fábrica B
566
Salario Nº de trabajadores Salario Nº de
trabajadores
800 20 800 10
1 000 10 1 000 30
1 200 10 1 200 30
1 500 10 1 500 20
7 500 50 7 500 10
Comenzamos creando una tabla con los datos de las dos distribuciones
de salarios en sus columnas. Para calcular los índices de Gini relativos a ambas
distribuciones, creamos las columnas de nombres pA, pB, pTnA y pTnB (sumas
acumuladas de nA, nB, T*nA y T*nB respectivamente).
La Figura 7-33 presenta las fórmulas para el cálculo de los índices de Gini
de las empresas A y B, y la Figura 7-34 presenta los resultados.
567
Figura 7-33
Figura 7-34
568
opción Dispersión con líneas suavizadas del grupo Gráficos de la ficha Insertar
y obtenemos la curva de Lorenz de la empresa A (Figura 7-36). Realizando
pasos similares para la empresa B, se obtiene su curva de Lorenz (Figura 7-37).
Figura 7-35
569
Figura 7-36 Figura 7-37
La curva de Lorentz de la empresa A está más alejada de la diagonal que la
de la empresa B, luego la distribución de la renta es mejor en la empresa B,
siendo la concentración menor en dicha empresa. No olvidemos que la curva de
Lorentz es más curvada (se aleja más de la diagonal) cuanto más desigual sea
la distribución y más fuerte la concentración.
570
571