P. 1
AJR_CURSO_BASICO_DE_ESTADISTICA_DESCRIPTIVA

AJR_CURSO_BASICO_DE_ESTADISTICA_DESCRIPTIVA

|Views: 98|Likes:
Publicado porADAMA.CORVI

More info:

Published by: ADAMA.CORVI on Feb 07, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

02/01/2013

pdf

text

original

CURSO BASICO DE ESTADISTICA DESCRIPTIVA

ÍNDICE
Temas
Tema 1º Tema 2º Tema 3º Tema 4º Tema 5º Tema 6º Tema 7º Tema 8º Tema 9º Tema 10º

Título
Introducción. Distribución de tablas de frecuencia. Medidas de Tendencia o Posición. Medidas de Dispersión. Medidas de Asimetría y Curtosis. Medidas de Concentración. Series estadísticas de dos variables. Ajuste y Regresión de dos variables. Análisis de la Correlación. Números Índices. Ejercicios. Test.

Página
1 6 13 25 31 39 43 49 56 64 72 96

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

TEMA 1º - INTRODUCCIÓN
1º- DEFINICIÓN DE ESTADÍSTICA
La Estadística es la ciencia que tiene por objeto recoger de forma agrupada la información que se produce de fenómenos reiterativos o no ocasionales. Se utiliza en múltiples áreas del conocimiento humano: ciencias naturales, bioestadística, ciencias sociales, estadística económica, etc. La Estadística ha centrado su desarrollo sobre todo en la economía. Hasta mediados del siglo XIX, la palabra “estadística” se usaba como referencia a las informaciones de tipo socioeconómico sobre la realidad de un Estado. Etimológicamente alude a “Ciencia de los Estados”. Dos definiciones más comunes: 1. La ciencia que se ocupa de la obtención de información y que proporciona instrumentos para la toma de decisiones cuando prevalecen condiciones de incertidumbre. 2. La rama del método científico que se ocupa de los datos obtenidos contando o midiendo las propiedades de determinados colectivos (poblaciones). Cabe destacar que en la actualidad muchas veces existe un exceso de información que es preciso sintetizar mediante la utilización de técnicas estadísticas; esta información debidamente tratada da una posibilidad de tomar decisiones en un entorno de incertidumbre. Por ejemplo, la OMT (Organización Mundial del Turismo) recoge datos sobre el número de visitantes, ingresos y pagos debidos al turismo, etc., para la mayoría de los países del mundo. Con estos datos se pueden analizar las tendencias de movimientos de turistas en diferentes zonas del mundo y hacer previsiones de futuro; evidentemente no existe nunca una certeza total puesto que aunque existan ciertas tendencias, y puedan darse pautas de actuación en función de las mismas, estas pueden variar de improviso si ocurren circunstancias no previstas, como por ejemplo, guerras, catástrofes naturales, cambios en los gustos de los consumidores, etc.

2º- CLASIFICACIÓN DE LA ESTADÍSTICA
La estadística se divide en dos partes: a) Estadística Descriptiva. Técnica o método que se sigue para recoger, organizar, resumir, presentar y analizar los resultados de las observaciones de los fenómenos reales. Describe y analiza las características de una población o de una muestra, deduciendo de esta descripción conclusiones sobre su estructura y composición y sobre las relaciones existentes con otros colectivos diferentes, con los cuales se compara.

________________________________________________________________________________________________________________________ Página 1

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

En el campo del turismo esta parte de la estadística sirve para: • Análisis univariente. Conocer las características individuales de un colectivo, por ejemplo, proporción de mujeres, edad media, de los visitantes de un museo, etc.; para conocer el tipo de bebida más consumida en el bar, en las habitaciones de un hotel, etc. • Análisis bivariante. Relacionar dos variables, por ejemplo, la influencia de la devaluación monetaria sobre el número de visitantes de un país, para el análisis histórico de variables como: número de visitantes, ingresos por turismo, ventas de una agencia de viajes, etc. • Análisis multivariante. Relacionar mas de dos variables, por ejemplo, agrupar los visitantes de un parque natural en diferentes tipologías tomando en consideración varias variables, para que a cada tipo puedan ofrecérsele diferentes productos o servicios, etc. b) Inferencia Estadística. Ciencia que utilizando como instrumento el cálculo de probabilidades estudia las leyes de comportamiento de aquellos fenómenos que dependen del azar. En una segunda fase, generaliza leyes, es decir, basándose en los resultados obtenidos del análisis de una muestra de la población, infiere (deduce) o estima las leyes generales del comportamiento de esa población. En turismo, igual que en otros campos, se utiliza para: • Realizar estudios de mercado, por ejemplo, para conocer si un producto turístico tendrá aceptación. • Realizar un control de calidad, por ejemplo, conocer el grado de satisfacción sobre sus servicios, de los clientes de un hotel. • Realizar otros tipos de estudios, por ejemplo, tipo de visitantes de una determinada zona, etc. En todos estos casos, dada la imposibilidad de conocer la opinión de toda la población sólo se utiliza una muestra representativa de la misma y los resultados se generalizan a toda la población. La teoría matemática de la probabilidad es la base en que se apoya la inferencia estadística. Algunos de los modelos de probabilidad (binomial, normal, etc.) pueden tener aplicación en el mundo del turismo, puesto que proporcionan la probabilidad de que ocurra un determinado hecho, lo cual puede ayudar a decidir s una determinada acción debe realizarse. Por ejemplo, si existe una elevada probabilidad de que un grupo de alemanes alojados en un hotel tomen cerveza, el hotel procurara tener un volumen de existencias suficientes de esta bebida, para dar satisfacción a sus clientes, y a la vez, obtener unas ganancias.

________________________________________________________________________________________________________________________ Página 2

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

3º- LOS CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
Población: - Conjunto de elementos que cumplen una determinada característica. - Por ejemplo: conjunto de clientes del hotel Plaza de Madrid durante el mes de enero de 2.005 (sitio concreto y en una fecha determinada). Individuo o Unidad de Investigación: Cada uno de los elementos de la población de distinta naturaleza. Por ejemplo: personas, edificios, oficinas, etc. Las investigaciones estadísticas pueden ser: a) Censales: se estudian las características de interés en todos los individuos de la población. b) Muestrales: el estudio sólo afecta a un subconjunto de los individuos de la población. Muestra: - Definición: Cualquier subconjunto de individuos pertenecientes a una población determinada. - En estadística, tienen interés las muestras que son representativas de la población, de tal forma que puedan inferirse conclusiones sobre el conjunto del colectivo o población investigada. - Para diseñar una muestra representativa de esta población, debemos tener en cuenta las “posibles diferencias” que pudieran ejercer determinadas características de la población sobre nuestra variable de interés (como el motivo y duración de la visita de los clientes del hotel, etc.). - Al elegir la muestra, debemos procurar que estén representados adecuadamente los distintos subconjuntos de la población. Representatividad de una muestra: Un concepto estadístico que nos indica si los resultados extraídos de la misma son o no utilizables para inferirlos a la población.

________________________________________________________________________________________________________________________ Página 3

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Parámetros: - Características poblacionales que deseamos investigar y que suelen ser desconocidas a priori. - Por ejemplo: la nacionalidad de los visitantes a un museo. - Las características poblacionales de los parámetros, pueden ser: 1. Variables: cuando estas características son numéricas, es decir, que se pueden medir. Por ejemplo: años de edad, renta anual en euros, etc. Y a la vez se subdividen las variables en: a) Continuas: si toman un número infinito no numerable. Por ejemplo: temperatura, edad, el peso o la altura de las personas, la distancia entre dos puntos, etc. La mayor parte de las variables continuas pueden tratarse como discretas, por ejemplo, si valoramos la edad de las personas en años, despreciando las unidades de tiempo menores (días, horas...). Una variable continua se convierte en variable discreta. b) Discretas: si toman un número finito de valores en un intervalo. Por ejemplo: número de hijos de una familia, número de coches de un país, etc. 2. Atributos: cuando las características de la población no son susceptibles de medirse. Por ejemplo: color del pelo, profesión, estado civil, sexo, etc. Presentan modalidades o categorías, como por ejemplo, sexo puede adoptar las modalidades de hombre o mujer. Los atributos pueden clasificarse en: a) Ordenables: los que sugieren una ordenación. Por ejemplo: el grado de satisfacción con el trato recibido (excelente, bueno, regular, malo). b) No ordenables: son los que sólo admiten una ordenación alfabética o casual. Por ejemplo: estado civil, nacionalidad de un turista, etc. El atributo más simple es el que sólo presenta dos modalidades. Por ejemplo: presencia/ausencia, favorable/desfavorable, etc. Las variables o características estudiadas pueden estar referidas o no a un determinado período de tiempo, entonces tendremos dos tipos de datos: 1. Variables temporales o históricas: son las referidas a distintos momentos del tiempo y adoptan en general la forma de serie, por ejemplo, serie mensual de visitantes a un museo. 2. Variables atemporales o de corte transversal: están referidas a un momento o período concreto y más o menos largo, por ejemplo, las personas que visitaron Toledo el mes de agosto de 2.004.

________________________________________________________________________________________________________________________ Página 4

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Fuentes de información estadística: - Son aquellas que proporcionan los datos sometidos al análisis estadístico. - Se clasifican en dos tipos: 1. Fuentes de información primarias: son las elaboradas con un fin determinado (ad hoc) para la propia investigación. 2. Fuentes de información secundarias: son las ya existentes y han sido elaboradas por otros agentes o investigadores ajenos a nuestra investigación. En cualquier estudio estadístico es conveniente comenzar realizando una investigación sobre las posibles fuentes de información secundarias porque el coste de la información primaria es normalmente más caro e incluso a veces evita la recogida de cierta información inicialmente prevista y que se descubre que ya está disponible.

4º- LA OBTENCIÓN DE DATOS MEDIANTE CUESTIONARIOS
La obtención de información directa es siempre un problema complejo que debe enfocarse de forma diferente en cada caso y para el que no existen unas reglas generales. En las operaciones estadísticas aplicadas a las ciencias sociales, las investigaciones deben seguir estos pasos: 1. Deben iniciarse con una clara definición o delimitación de un problema. 2. Formulación de unas hipótesis de trabajo y de un modelo estadístico explicativo. 3. Elaboración de unas conclusiones que confirmen o no las hipótesis inicialmente planteadas o estimaciones sobre las relaciones del modelo inicialmente diseñado. 4. Es relativamente habitual que estas “confirmaciones” sean siempre matizadas, valoradas o interpretadas. De otra forma, estas cuatro etapas son: 1. Etapa previa de estudio y planteamiento de la investigación, en la que queden lo más claros posibles los objetivos que se persiguen. 2. Etapa preparatoria de los trabajos de campo, en la que se defina la información a obtener, el soporte o cuestionario con la que va a ser demandada. 3. Etapa de observación o de trabajo de campo. 4. Etapa de tratamiento de la información obtenida.

________________________________________________________________________________________________________________________ Página 5

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

TEMA 2º - DISTRIBUCIÓN DE TABLAS DE FRECUENCIA UNIDIMENSIONALES
1º- CONCETOS BÁSICOS
El conjunto de valores que toma una variable se denomina “distribución de frecuencias”, puede ser: • unidimensionales • bidimensionales • multidimensionales En la notación más habitual que emplearemos a continuación designaremos: X, variable o característica objeto de estudio. Xi, valor que toma la variable X en el individuo i. ni, número de veces o frecuencia con la que aparece un determinado valor Xi N, número de unidades en las cuales efectuamos la medición o disponemos de datos. • Frecuencia absoluta (ni): número de veces que se presenta un valor en la población analizada. • Frecuencia absoluta acumulada (Ni): es la frecuencia absoluta de un determinado valor Xi más la suma de las frecuencias absolutas de todos los valores anteriores. • Frecuencia relativa (fi): Cociente entre la frecuencia absoluta y la frecuencia total de datos. • Frecuencia relativa acumulada (Fi): Suma de las frecuencias relativas fi de un determinado valor ordenado Xi y de los valores inferiores a él. TIPOS DE DISTRIBUCIONES DE FRECUENCIAS • Distribuciones de tipo I: donde los valores no se repiten en ningún caso. • Distribuciones de tipo II: donde cada valor de los datos estadísticos se repite un determinado número de veces. • Distribuciones de tipo III: donde las observaciones están clasificadas en intervalos. Cuando son variables continuas o discretas (presentan muchos valores) es conveniente agruparlos en intervalos.

________________________________________________________________________________________________________________________ Página 6

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

CONSTRUCCIÓN DE TABLAS DE FRECUENCIAS NO UNITARIAS EN DISTRIBUCIONES DE TIPO II Se realizan de la siguiente forma: 1. 2. 3. 4. Ordenación de los datos. Recuento de las frecuencias absolutas. Agrupación de los datos. Construcción de una tabla estadística de frecuencias: ni, Ni, fi, Fi

Por ejemplo: Las puntuaciones, de 0 a 10, otorgadas por 30 clientes de un hotel sobre la percepción de la limpieza general: 344298921567816746439980888937 Ordenación de datos: 011223334444566677788888899999 Tabla de frecuencias: Xi 0 1 2 3 4 5 6 7 8 9 ni 1 2 2 3 4 1 3 3 6 5 30 Ni 1 3 5 8 12 13 16 19 25 30 fi 1/30 2/30 2/30 3/30 4/30 1/30 3/30 3/30 6/30 5/30 1 Fi 1/30 3/30 5/30 8/30 12/30 13/30 16/30 19/30 25/30 30/30 = 1

________________________________________________________________________________________________________________________ Página 7

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

CONSTRUCCIÓN DE TABLAS DE FRECUENCIAS NO UNITARIAS EN DISTRIBUCIONES DE TIPO III. CON DATOS AGRUPADOS EN INTERVALOS • La amplitud del intervalo es la diferencia entre los dos extremos del intervalo. En estas distribuciones interesa elegir una amplitud lo suficientemente pequeña para que la pérdida de información sea lo menor posible, pero lo suficientemente grande para que la distribución no tenga demasiados intervalos. Por tanto, a menor amplitud mejor información se obtiene, a mayor amplitud la informacion es menos interesante. • La notación para los intervalos es la siguiente: L i - 1 = Límite inferior del intervalo L i = Límite superior del intervalo ai = amplitud de un intervalo = L i - L i - 1 • Marca de clase: es el punto medio de cada intervalo.
Por ejemplo: Una sociedad del sector maderero ha adquirido troncos de cierta variedad forestal para su posterior transformación. Al recibirlos, ha decidido clasificarlos según tramos de metros cúbicos por unidad. El resultado de esta operación ha sido recogido en la siguiente tabla. Se pide completar la tabla de frecuencias.

Metros cúbicos 0 – 0,25 0,25 – 0,5 0,5 – 1 1–2 2–5

Frecuencias absolutas 1235 187 50 18 10
xi = Li −1 + Li 2

Para calcular las marcas de clase: L i-1 - L i 0 – 0,25 0,25 – 0,5 0,5 – 1 1–2 2–5 xi 0,125 0,375 0,75 1,5 3,5 ni 1235 187 50 18 10 1500

Ni 1235 1422 1472 1490 1500

fi 1235/1500 187/1500 50/1500 18/1500 10/1500 1

Fi 1235/1500 1422/1500 1472/1500 1490/1500 1500/1500 =1

________________________________________________________________________________________________________________________ Página 8

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

2º- REPRESENTACIÓN GRÁFICA
1. Diagrama de barras. Es una representación gráfica que se utiliza para distribuciones de frecuencia de tipo II. Se dibuja un sistema de ejes de coordenadas; en el eje de abcisas se representa los valores de las variables, y en el eje de ordenadas los valores de ordenadas los valores de las frecuencias absolutas. Se construyen unas columnas de altura igual a la frecuencia de cada uno de los valores. Xi 1 3 5 8 11 ni 2 7 5 4 1

2. Histogramas. Es una representación gráfica que se utiliza con frecuencia para distribuciones del tipo III. Se dibuja un sistema de ejes de coordenadas, en el eje de abcisas se representan los valores de los intervalos de las variables y en el eje de ordenadas los valores de las alturas (hi), siendo hi = ni / ai. Se construyen unos rectángulos cuya área será igual a la frecuencia absoluta del intervalo en estudio. L i-1 - L i 0 - 10 10 – 30 30 – 50 50 – 80 80 - 110 ni 2 7 5 4 1 hi = ni /ai 0,20 0,35 0,25 0,13 0,03

________________________________________________________________________________________________________________________ Página 9

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

3. Polígonos de Frecuencias. Es una representación gráfica que se utiliza con frecuencia para distribuciones del tipo II y del tipo III. Consiste en unir mediante una línea quebrada los extremos superiores de las columnas, si se trata de una distribución del tipo II, o los puntos medios de las bases superiores de los rectángulos del histograma, si se trata de una distribución del tipo III.

8 7 6 5 4 3 2 1 0 1 2 3 4 5

9 8 7 6 5 4 3 2 1 0 ni

________________________________________________________________________________________________________________________ Página 10

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

4. Superficies Representativas, Diagrama de Sectores o Sectores Circulares. Es una representación gráfica en la que los datos vienen sustituidos por superficies de área proporcional al valor de las frecuencias.

________________________________________________________________________________________________________________________ Página 11

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

5. Pictogramas y Cartogramas. Los pictogramas consisten en representar mediante figuras alegóricas las cantidades de la serie estadística. Cada figura representa un cierto número de unidades. Algunas veces el pictograma adopta otros métodos comparativos, especialmente cuando se trata de comprar dos o tres valores solamente. En estos casos se realiza un dibujo en tamaño proporcional a los valores. Este tipo de gráfico es más bien de tipo publicitario que científico ya que muchas veces es poco preciso. Por ejemplo: el número de viajeros de un tren turístico durante los meses de Julio, Agosto, Septiembre del pasado año, ha sido de 100, 600 y 300 respectivamente.

Julio

Agosto

Septiembre

Los cartogramas son mapas en los que, mediante signos convenientes, se representan la distribución geográfica de los hechos estudiados. Los signos que se emplean pueden ser colores, números, figuras geométricas, etc. Este tipo de gráficos tiene el inconveniente de que, instintivamente, a las zonas más extensas les asociamos intensidades mayores del fenómeno, y por tanto errores de interpretación.

________________________________________________________________________________________________________________________ Página 12

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

TEMA 3º - MEDIDAS DE TENDENCIA O POSICIÓN
1º- CARACTERIZACIÓN DEL VALOR CENTRAL
Recogidos los datos de un colectivo, es necesario obtener un conjunto de números que nos permita, con mayor facilidad, hacer los estudios y comparaciones necesarios. Nos encontramos con los promedios, (medidas de centralización), y las desviaciones (medidas de dispersión). Para que un valor pueda considerarse como valor central ha de reunir las siguientes características: debe estar rígidamente definido. debe basarse en todas las observaciones hechas. debe ser fácil y rápido de calcular. debe estar lo menos afectado posible por las fluctuaciones de la selección. debe ser adaptable al cálculo algebraico.

2º - LA MEDIA ARITMETICA. PROPIEDADES
La media aritmética se define como la suma de todos los valores, dividida por el número de ellos. • Para distribuciones del tipo I:

x =


N

xi

Por ejemplo: calcular la media aritmética de la siguiente distribución correspondiente a la renta en unidades monetarias que perciben cinco familias. xi 150 175 200 250 300
x= 150 + 175 + 200 + 250 + 300 = 215u.m 5

________________________________________________________________________________________________________________________ Página 13

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

• Para distribuciones del tipo II y III:

x=

∑x n
N

i i

Media aritmética ponderada.

Por ejemplo: calcular la media aritmética con los datos de la siguiente tabla: xi ni 0 1 2 3 4 10 4 1 4 1
x= (0 ⋅ 4) + (1 ⋅ 10) + (2 ⋅ 4) + (3 ⋅ 1) + (4 ⋅ 1) = 1'25 20

Por ejemplo: calcular la media aritmética con los datos de la siguiente tabla: L i-1– L i 5.000 – 9.000 9.000 – 13.000 13.000 – 17.000 17.000 – 21.000 21.000 – 25.000 xi

7.000 11.000 15.000 19.000 23.000

ni 3 4 7 5 6
Li −1 + Li 2

Primero necesitamos calcular las marcas de clase: xi =
x=

(7000 ⋅ 3) + (11000 ⋅ 4) + (15000 ⋅ 7) + (19000 ⋅ 5) + (23000 ⋅ 6) = 16.120 25

Cuando la serie estadística presenta valores de la variable muy grandes, se pueden aplicar métodos abreviados de cálculo: a) Cuando el salto de la variable es no constante o igual a la unidad:
x = OX
+

∑ (x − O )n
i x

i

N

donde Ox , conviene que sea el valor central de los que toma la variable, para reducir al máximo los cálculos.

________________________________________________________________________________________________________________________ Página 14

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: calcular la media aritmética con los datos de la siguiente tabla: xi 70.132 70.133 70.134 70.135 70.136 Si Ox = 70.134
x = 70.134 +
−1 = 70.133,95 20

ni 2 4 8 5 1 20

xi – Ox -2 -1 0 1 2

(xi – Ox) ni -4 -4 0 5 2 -1

b) Cuando el salto de la variable es constante:

x = OX

+

∑⎜ ⎝

⎛ xi − Ox ⎞ ⎟ni a ⎠ ai N

donde Ox , conviene que sea el valor central de los que toma la variable, para reducir al máximo los cálculos. Por ejemplo: calcular la media aritmética con los datos de la siguiente tabla: xi 40.000 40.100 40.200 40.300 ni 3 2 5 1 11
xi − OX a

⎛ xi − Ox ⎞ ⎜ ⎟ni ⎝ a ⎠

-2 -1 0 1

-6 -2 0 1 -7

Si Ox = 40.200 y a i = 100
x = 40.200 + −7 ⋅100 = 40.136,36 11

________________________________________________________________________________________________________________________ Página 15

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Propiedades de la media aritmética • A la media aritmética se la considera el centro de gravedad de la distribución, ya que la suma de las desviaciones de los valores con respecto a su media aritmética es igual a cero. Se demuestra asi:

∑ ( x i – x ) ni = ∑ x i ni - ∑ x ni = N x – x N = 0
x=

∑x n
N

i i

⇨ N x = ∑ x i ni

• Si se multiplican o dividen todos los valores de la variable por una constante, la media de los mismos queda multiplicada o dividida por dicha constante. Es decir: Media de a ⋅ xi = ∑
axi x = a∑ i = a⋅x N N

• Si se suman o restan todos los valores de la variable por una constante, la media de los mismos queda aumentada o disminuida en ese mismo valor. Es decir: Media de a + xi = ∑ Por ejemplo:
xi 2 4 8 10 12 ∑ = 36 ∑ (xi – 7,2 ) - 5,2 - 3,2 0,8 2,8 4,8 ∑=0 3 ⋅ xi 6 12 24 30 36 ∑ = 108 5 + xi 7 9 13 15 17 ∑ = 61

(a + xi )
N

=

Na ∑ xi + =a+x N N

x=
3· x =

∑x n ∑
N

i i

N xi ni

= = =

36 = 7,2 5 108 = 21,6 5 61 = 12,2 5

5+ x=

∑x n
N

i i

________________________________________________________________________________________________________________________ Página 16

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

3º - LA MEDIA GEOMETRICA
Se define la media geométrica, como la raíz de índice igual al número de factores que se “promedian”, del producto de todos ellos.

G=

N

x ⋅ x ⋅ ... ⋅ x
n1 1 n2 2

nr r

=N

∏x
r 1

i

Por ejemplo: calcular la media geométrica de la siguiente distribución: xi ni 1 2 3 7 5 5 8 4 11 1

19
= 4,02

G = 19 1 2 · 3 7 · 5 5 · 8 4 · 11 1

O también: log G = log G =
1 [ 2 log 1 + 7 log 3 + 5 log 5 + 4 log 8 + 1 log 11] 19 1 [ 11,4884] = 0,6046 ⇨ G = 10 0,6046 = 4,02 19

Por ejemplo: calcular la media geométrica de la siguiente distribución: xi ni 7.000 11.000 15.000 19.000 23.000 3 4 7 5 6

25

G = 25 70003 ⋅ 110004 ⋅ 150007 ⋅ 190005 ⋅ 230006 = 15.132

O también: log G = log G =
1 [ 3 log 7.000 + 4 log 11.000 + 7 log 15.000 + 5 log 19.000 + 6 log 23.000] 25 1 [ 104,4976387] = 4,1799 ⇨ G = 10 4,1799 = 15.132,12 25

________________________________________________________________________________________________________________________ Página 17

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

4º - LA MEDIA ARMONICA
La media armónica se define como el inverso de la media aritmética, de los inversos de los valores de la variable.
H= N

1 xi

en distribuciones tipo I. H =

N


r

1

ni xi

en distribuciones tipo II y III.

Por ejemplo: Un automóvil realiza los siguientes recorridos 200, 300 y 400 kilómetros a las velocidades medias de 50, 60 y 80 Km/hora. Calcule la velocidad media para el recorrido total. xi 50 60 80 ni 200 300 400 900

En este ejemplo los valores de la variable xi son las velocidades medias del vehículo en cada recorrido, y los recursos producidos son las distancias que se han recorrido.
H= 900 = 64km / hora 200 300 400 + + 50 60 80

Por ejemplo: Cuatro fincas han producido 100, 120, 150 y 200 quintales métricos de trigo con unos rendimientos de 10, 15, 12 y 18 quintales métricos de trigo por hectárea. Calcular el rendimiento medio. xi 10 12 15 18 ni 100 150 120 200 570
H= 570 = 13, 69Qm / Ha 100 150 120 200 + + + 10 12 15 18

________________________________________________________________________________________________________________________ Página 18

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

5º- LA MEDIA CUADRATICA
La media cuadrática se define como la raíz cuadrada de la media aritmética, de los cuadrados de los valores de la variable.
C=

∑x
N

2 i

en distribuciones tipo I. C =

∑x

2 i

ni

N

en distribuciones tipo II y III.

Por ejemplo:
xi 1 3 5 8 11 ni 2 7 5 4 1 19
C=

x i ni
2 21 25 32 11 91
ni

ni xi
2 1 7 3 5 5 4 8 1 11

xi2 ni
2 63 125 256 121 567

5,924

∑x

2 i

N

=

567 = 5, 46 19

6º- COMPARACION ENTRE LAS DISTINTAS MEDIAS
Si comparamos las medias en cuanto a su “magnitud”, quedan ordenadas del siguiente modo: Armónica < Geométrica < Aritmética < Cuadrática ⇨ H < G < x < C Del ejemplo anterior, podemos calcular:
N

H=


r

1

ni xi

=

19 = 3,207 ⇨ G = 19 1 2 · 3 7 · 5 5 · 8 4 · 11 1 5,924

= 4,02

x=

∑ x n = 91 = 4,78
i i

N

19

C=

∑x

2 i

ni

N

=

567 = 5, 46 19

________________________________________________________________________________________________________________________ Página 19

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

7º- LA MODA
La moda se define como el valor de la variable que más veces se repite. En una distribución de frecuencias es el valor de la variable que viene afectado por la máxima frecuencia de la distribución. • Cálculo de la Moda en las distribuciones del tipo II. xi 1 ni 2

3
5 8 11

7
5 4 1 19

La Mo = 3, ya que es el valor de la variable que más veces se repite, al ser su frecuencia absoluta igual a 7.

• Cálculo de la Moda en las distribuciones del tipo III, con amplitud constante. L i-1 - L i 0 – 20 20 – 40 ni 20 30

40 – 60

50

60 – 80 80 – 100

10 20

Mo = Li −1 +

10 ni +1 ⋅ 20 = 45 ai = 40 + ni +1 + ni −1 10 + 30

• Cálculo de la Moda en las distribuciones del tipo III, con amplitud no constante. L i-1 - L i 0 – 10

ni
2

hi =

ni ai

10 – 30

7

0,35
0,25 0,13 0,03

0,20

30 – 50 50 – 80 80 – 110

5 4 1

Mo = Li −1 +

0,25 hi +1 a i = 10 + ⋅ 20 = 21,11 hi +1 + hi −1 0,25 + 0,20

________________________________________________________________________________________________________________________ Página 20

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

8º - LA MEDIANA
La mediana se define como el valor central de los valores de la variable, una vez que estos han sido ordenados en sentido creciente o decreciente. Por tanto, la mediana, gráficamente deja el 50% de los elementos a la izquierda y el 50% de elementos a la derecha. • Cálculo de la Mediana en distribuciones del tipo I, impares
xi 1 3

5

La Me = 5, ya que ordenados los valores de la variable el valor 5 deja igual número de valores a su alrededor.

8 11

• Cálculo de la Mediana en distribuciones del tipo I, pares
xi 1 3 5 8 11 13 5+8 = 6,5 , como el número de valores de la variable es par, calculamos la mediana 2 haciendo la media aritmética de los dos valores centrales.

Me =

• Cálculo de la Mediana en distribuciones del tipo II
xi 0 1 2 3 4 ni 4 10 4 1 1 Ni 4 14 18 19 20

N N 20 , en nuestro ejemplo = = 10 . 2 2 2 Buscamos en la columna de frecuencias absolutas acumulada N i el siguiente valor superior a 10. En este caso es Ni =14 que se corresponde con xi =1, por lo tanto la mediana es M e = 1
La frecuencia total será: N = 20 . Ahora calculamos

________________________________________________________________________________________________________________________ Página 21

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

• Cálculo de la Mediana en distribuciones del tipo III Los ingresos mensuales de 50 familias se recogen en la siguiente tabla, calcular la Mediana. L i-1 - L i 40 – 100 100 – 200 200 – 500 500 – 1.000 ni 10 20 15 5 50 Ni 10 30 45 50

N 50 = = 25 . El valor de Ni = 30 es el siguiente mayor a 25, el intervalo mediano será 2 2 N − N i −1 2 [100 - 200] y la mediana se calcula a través de: Me = Li −1 + ai siendo ai la ni

amplitud del intervalo.
M e = 100 +
25 − 10 ⋅ 100 = 175 u.m. 20

9º - LOS CUANTILES
La generalización del concepto de mediana da lugar a unas nuevas medidas de posición llamadas cuantiles: las que más se utilizan son los cuartiles, deciles y centiles. Existen tres cuartiles: el primer cuartil deja a su izquierda el 25% de los elementos y el otro 75% a la derecha; el segundo cuartil deja el 50% de los valores a la izquierda y el otro 50 % a la derecha; y el tercer cuartil deja el 75% de los valores a la izquierda y el 25% de valores a la derecha. Existen nueve deciles: el octavo decil es, por ejemplo, aquel valor de la variable que deja el 80% de valores a la izquierda y el 20% de datos a la derecha. Existen noventa y nueve centiles: el 30 centil es, por ejemplo, aquel valor de la variable que deja el 30% de valores a la izquierda y el 70% de datos a la derecha.

________________________________________________________________________________________________________________________ Página 22

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Como es evidente, la Mediana coincide con el 2º cuartil, el 5º decil y el 50º centil. El cálculo de los cuantiles se hace de forma semejante al cálculo de la mediana pero con el cociente
pN pN pN para los cuartiles, para los deciles, y para los centiles; donde p es el 4 10 100

número del cuantil que queremos calcular. • Cálculo de los Cuantiles en distribuciones del tipo II En la siguiente distribución determinar el 3º cuartil, el 7º decil y el 99º centil. xi 1 3 4 5 7 9 ni 20 30 20 40 7 3 120 Ni

20 50 70 110 117 120

3º cuartil: 7º decil:

3 ⋅ 120 = 90 ⇒ Q 3 = 5 4

7 ⋅ 120 = 84 ⇒ D7 = 5 10 99 ⋅ 120 = 118,8 ⇒ P99 = 9 100

99º centil:

________________________________________________________________________________________________________________________ Página 23

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

• Cálculo de los Cuantiles en distribuciones del tipo III Se calculan utilizando las siguientes fórmulas:
pN − N i −1 Para los Cuartiles: Qp = Li −1 + 4 ai ni pN − N i −1 10 Para los Deciles: Dp = Li −1 + ai ni pN − N i −1 100 Para los Centiles: Cp = Li −1 + ai ni

p = 1, 2, y 3

p = 1, 2, ….. 9

p = 1, 2, …… 99

En la siguiente distribución determinar el 1º cuartil, el 3º decil y el 70º centil. L i-1 - L i 0 – 10 10 – 30 30 – 50 50 – 80 80 – 110 ni 2 7 5 4 1 19 Ni

2 9 14 18 19

1º cuartil: 3º decil: 70º centil:

1⋅19 4,75 − 2 = 4,75 ⇒ Q1 = 10 + ⋅ 20 = 17,85 7 4 3 ⋅19 = 5,7 10

⇒ D3 = 10 +

5,7 − 2 ⋅ 20 = 20,57 7

70 ⋅ 19 13,3 − 9 = 13,3 ⇒ C70 = 30 + ⋅ 20 = 47,2 100 5

________________________________________________________________________________________________________________________ Página 24

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

TEMA 4º - MEDIDAS DE DISPERSIÓN
1º- REPRESENTATIVIDAD DE LA MEDIA: CENTRALIZACIÓN Y DISPERSIÓN
De todas las medidas de centralización, es la media aritmética la que mejor reúne las características que debe tener un promedio; sin embargo, para complementar esta información, es necesario calcular un coeficiente que nos indique el grado de dispersión de los valores de las variables respecto a la media. Una media aritmética será más representativa cuánto más concentración representen alrededor suyo los valores de la variable. Cuánto mayor dispersión exista entre dichos valores y su media, menos fiable será el valor de la media.

2°- RECORRIDO O RANGO
El recorrido se define como la diferencia entre el valor de la variable numéricamente superior y el inferior. Su cálculo es muy sencillo y, aunque su información es imperfecta, nos orienta en ciertas ocasiones de una forma rápida. Por ejemplo: calcular el recorrido de la siguiente distribución:
xi

-4

-2

0

3

9

Re = 9 – ( – 4) = 13

3°- DESVIACIÓN A LA MEDIA Y A LA MEDIANA
• Desviación a la Media, se define como la media aritmética de los valores absolutos de las diferencias entre los valores de la variable y su media aritmética. Y su fórmula es:

DX =

∑x

i

− x ni N

• Desviación a la Mediana, se define como la media aritmética de los valores absolutos de las diferencias entre los valores de la variable y su mediana. Y su fórmula es:

DMe =

∑x

i

− Me ni N

________________________________________________________________________________________________________________________ Página 25

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: calcular la desviación media de la siguiente serie estadística, respecto a la media aritmética y a la mediana.

xi
1 3 5 8 11

ni
2 7 5 4 1 19
i

x i ni
2 21 25 32 11 91

Ni 2 9 14 18 19

xi − x
3,78 1,78 0,22 3,22 6,22

xi − x ni
7,56 12,46 1,10 12,88 6,22 40,22

xi − Me
4 2 0 3 6

xi − Me ni
8 14 0 12 6 40

x=

∑x

ni

N

=

40,22 91 = 4,78 ⇒ D X = = 2,11 19 19

N 19 40 = = 9,5 ⇒ Me = 5 ⇒ DMe = = 2,10 2 2 19

4°- VARIANZA Y DESVIACIÓN TIPICA
Dentro de las medidas de dispersión, la varianza y la desviación típica (o estándar) destacan sobre las demás, al igual que ocurre entre las medidas de posición con media aritmética. La varianza se define como, la media aritmética de los cuadrados de las diferencias entre los valores de las variables y su media aritmética.

• Para distribuciones del tipo I se calculan:
2 X

S

∑ (x =

i

− x)

2

N

∑x =
N

2 i

⎛ ∑ xi −⎜ ⎜ N ⎝

⎞ ⎟ ⎟ ⎠

2

• Para distribuciones del tipo II y III, se calculan:
2 X

S

∑ (x =
2 i

i

− x ) ni
2

N
2

∑ (x =
2

2 i

+ x 2 − 2 x i x ni N ni

)

∑x =
2 i

2 i

ni

N

+ x2 ⎞ ⎟ ⎟ ⎠

∑n
N
2

i

− 2x

∑x n
i

i

N

=

∑x =

ni

N

+ x − 2x

∑x =

2 i

N

∑x − (x ) =
2

ni

N

⎛ ∑ x i ni −⎜ ⎜ N ⎝

Cuanto más elevado sea el valor de la varianza, más dispersión existirá, y la media será menos representativa. La desviación típica, se define como la raíz cuadrada positiva de la varianza. Y se simboliza con S X .

________________________________________________________________________________________________________________________ Página 26

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: calcular la varianza y la desviación típica de la siguiente serie estadística.

xi

ni

x i ni

xi2

xi2 ni

( xi − x )
- 3,789 - 1,789 0,211 3,211 6,211

(xi − x )2
14,256 3,20 0,044 10,31 38,57

(xi − x )2 ni
28,713 22,403 0,222 41,24 38,57 131,148

1 3 5 8 11

2 7 5 4 1 19
x=

2 21 25 32 11 91
i i

1 9 25 64 121

2 63 125 256 121 567

∑xn
N

=

91 = 4,789 19
2

S

2 X

∑ (x =

i

− x ) ni N

=

131,148 = 6,902 ⇒ S X = 6,902 = 2,627 19
2 ⎞ ⎟ = 567 − ⎛ 91 ⎞ = 6,903 ⇒ S X = 6,903 = 2,627 ⎜ ⎟ ⎟ 19 ⎝ 19 ⎠ ⎠ 2

S

2 X

∑x n =
N

2 i i

⎛ ∑ xi ni −⎜ ⎜ N ⎝

• Para distribuciones del tipo II y III, y con cambio de escala o de origen se calculan:
⎡ d 2n ⎛ d n x − Ox ∑ i i −⎜∑ i i 2 di = i ⇒ SX = a2 ⎢ ⎜ N a ⎢ N ⎝ ⎣ ⎞ ⎟ ⎟ ⎠
2

⎤ ⎥ ⎥ ⎦

Por ejemplo: calcular la media, la varianza y la desviación típica de la siguiente serie estadística.

xi 20.000 20.002 Ox = 20.004 20.006 20.008 20.010

ni 10 12 14 9 6 2 53

di =

xi − O x a

d i ni

d i2 ni

-2 -1 0 1 2 3

- 20 - 12 0 9 12 6 -5

40 12 0 9 24 18 103

di =

xi − O X xi − 2004 = a 2

________________________________________________________________________________________________________________________ Página 27

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

x = OX

+

∑⎜ ⎝

⎛ xi − OX ⎞ ⎟ ni a ⎠ ⋅ ai = O X + N
2

∑d n
N

i i

⎛ −5⎞ ⋅ ai = 20.004 + ⎜ ⎟ ⋅ 2 = 20.003,81 ⎝ 53 ⎠

⎡ d 2n ⎛ d n ∑ i i −⎜∑ i i S =a ⎢ ⎜ N ⎢ N ⎝ ⎣
2 X 2

⎞ ⎟ ⎟ ⎠

2 ⎤ ⎡ ⎛ −5⎞ ⎤ 2 103 ⎥=2 ⎢ −⎜ ⎟ ⎥ = 7,73 ⇒ S X = 7,73 = 2,78 ⎥ ⎢ 53 ⎝ 53 ⎠ ⎥ ⎣ ⎦ ⎦

5°- COEFICIENTE DE VARIACIÓN DE PEARSON
Es el cociente entre la desviación típica y la media aritmética, expresado en porcentaje.
Cv = SX ⋅ 100 x

Este cociente cumple el cometido de permitir comparar dos o más distribuciones entre sí, ya que al dividir la desviación típica entre la media aritmética se elimina la influencia de la escala de medida, convirtiéndose en una medida abstracta susceptible de comparaciones. También es un coeficiente que se utiliza con mucha frecuencia en el estudio de una distribución aislada. Por ejemplo: La media del precio diario de las habitaciones de un hotel Inglés es de 30 libras con desviación típica igual a 10. Otro hotel de categoría análoga en la Costa Cálida tiene una media de precios de 50 € diarios, con una desviación típica igual a 9 €. ¿Donde es mayor la dispersión de precios?
Cv Inglés = CvCosta = SX 10 ⋅ 100 = ⋅ 100 = 33,33% x 30 SY 9 ⋅ 100 = ⋅ 100 = 18% y 50

⇨ La dispersión de precio es mayor en el hotel Inglés.

________________________________________________________________________________________________________________________ Página 28

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

6º- TIPIFICACIÓN DE UNA VARIABLE
A partir de una variable xi , de media x , y de desviación típica S X , podemos calcular otra variable Z i , mediante la siguiente transformación:
Zi = xi − x SX

Esta trasformación recibe el nombre de tipificación de una variable. La media aritmética de Z, y su desviación típica son iguales a 0 y a 1, respectivamente. a) Media:
⎛ xi − x ⎞ ⎟ ni ⎟ ⎝ SX ⎠

∑z n z=
N

∑⎜ ⎜
=

i i

N

=

1 SX

∑ (x

i

− x ) ni =0

N

b) Desviación Típica:
⎛x −x⎞ 1 2 ∑ ⎜ iS ⎟ ni S 2 2 ⎜ ⎟ ∑ (zi − z ) ni = ∑ zi ni = ⎝ X ⎠ = X 2 SZ = N N N
2

∑ (x

i

− x ) ni
2

N

=

1 2 ⋅ SX = 1 2 SX

SZ = 1

Por ejemplo: Calcular las variables tipificadas de la siguiente serie estadística y comprobar las dos propiedades de las variables tipificadas. xi 2 4 6 8 10 30
x= z= xi2 Zi = xi − 6 2,828 Z i2

4 16 36 64 100 220

- 1,414 - 0,707 0 0,707 1,414 0

2 0,5 0 0,5 2 5

30 220 2 = 6 ⇒ SX = − 6 2 = 8 ⇒ S X = 8 = 2,828 5 5 0 5 2 = 0 ⇒ SZ = − 02 = 1 ⇒ S X = 1 = 1 5 5

________________________________________________________________________________________________________________________ Página 29

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: un estudiante obtiene en Economía 80 puntos, siendo 75 el número medio de puntos obtenidos y 10 la desviación típica. En Geografía, obtiene 98 puntos, siendo la nota media 90 puntos y la desviación típica 15 puntos. ¿En qué asignatura obtiene una mejor posición? En Economía:
xi = 80, x = 75, S X = 10 ⇒ zi =
80 − 75 = 0,5 10

En Geografía:
y j = 98, y = 90, SY = 15 ⇒ z j =
98 − 90 = 0,53 15

⇨ Obtiene mejor posición en Geografía.

________________________________________________________________________________________________________________________ Página 30

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

TEMA 5º - MEDIDAS DE ASIMETRIA Y CURTOSIS
Cuando representamos una distribución de frecuencias, ésta puede presentar o no, algún eje de simetría perpendicular al de la variable. Nos encontramos entonces ante una distribución simétrica o asimétrica, respectivamente. Las medidas de asimetría nos van a proporcionar una información complementaria respecto de la conseguida a través de la media y la desviación típica, para conocer las características de la distribución. Como su nombre indica, las medidas de asimetría también nos van a informar acerca de la mayor o menor simetría del histograma de frecuencias de la distribución.

1º- DISTRIBUCIÓN NORMAL
Hay un cierto número de elementos de la naturaleza que se rigen por una distribución normal de frecuencias y que debido a su generalidad, se llamo distribución normal o campana de Gauss.

Debemos destacar de la distribución normal, que: 1. Es una curva simétrica. 2. El área situada bajo la curva coincide con el tamaño de la muestra. 3. Tiene una cota máxima en el centro y decrece constantemente hacia los extremos, pero nunca corta el eje de abcisas. 4. En la distribución normal, la media aritmética, la mediana y la moda coinciden. 5. La distribución normal tiene tres puntos de inflexión. El primero coincide con el valor de la desviación típica de la distribución. El segundo con dos veces el valor de la desviación típica y el tercer punto con el de la desviación típica, multiplicado por tres.

________________________________________________________________________________________________________________________ Página 31

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

2º- LA ASIMETRIA Y SUS COEFICIENTES
Habitualmente nos vamos a encontrar con distribuciones que van a presentar un desplazamiento en mayor o menor grado a la izquierda o a la derecha; diremos que la distribución presenta una cierta asimetría. Este desplazamiento los vamos a medir mediante el Coeficiente de Asimetría de Pearson:
As = x − Mo SX

Nos encontraremos entonces con los siguientes casos: • As = 0 ⇨ x = Mo ⇨ Simétrica • As > 0 ⇨ x > Mo ⇨Asimetría positiva, donde la parte principal de la distribución queda a la derecha. • As < 0 ⇨ x < Mo ⇨ Asimetría negativa, donde la parte principal de la distribución queda a la izquierda.
y
y

7

12

6

10

5 4

8

6

3
4

2
2

1
0

0 1 2 3 4 5

1

2

3

4

5

As = 0 ⇨ x = Mo
y

As > 0 ⇨ x > Mo

12

10

8

6

4

2

0 1 2 3 4 5

As < 0 ⇨ x < Mo

________________________________________________________________________________________________________________________ Página 32

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

El Coeficiente de Asimetría de Pearson, es válido para distribuciones en forma de campana, cuando no es así, se utiliza otro coeficiente, denominado Coeficiente de Asimetría de Fisher, y se simboliza como m3 , cuya expresión es:
⎛ 1 m3 = ⎜ ⎜S ⎝ X ⎞ ⎟ ⎟ ⎠
3

∑ (x

i

− x ) ni
3

N

• Para distribuciones del tipo II y III, y desarrollando la expresión anterior:
⎛ 1 m3 = ⎜ ⎜S ⎝ X ⎞ ⎟ ⎟ ⎠
3

⎡ x3n ⎛ xn xn x2n ⎢∑ i i − 3⋅ ∑ i i ⋅ ∑ i i + 2 ⋅⎜ ∑ i i ⎜ N N N ⎢ N ⎝ ⎣

⎞ ⎟ ⎟ ⎠

3

⎤ ⎥ ⎥ ⎦

• Para distribuciones del tipo II y III, y aplicando el cambio de escala o de origen, la expresión sería la siguiente:
⎛ a m3 = ⎜ ⎜S ⎝ X ⎞ ⎟ ⎟ ⎠
3

⎡ d 3n ⎛ dn dn d 2n ⎢∑ i i − 3⋅ ∑ i i ⋅ ∑ i i + 2 ⋅⎜ ∑ i i ⎜ N N N ⎢ N ⎝ ⎣

⎞ ⎟ ⎟ ⎠

3

⎤ ⎥ ⎥ ⎦

3º- RELACIÓN EMPIRICA ENTRE LA MEDIA, LA MEDIANA Y LA MODA En las distribuciones de frecuencias de forma de campana y tan sólo moderadamente asimétricas, se cumple la siguiente relación empírica:
x − Mo = 3 ( x − Me )

por lo que podemos calcular el Coeficiente de Asimetría de Pearson, también de la siguiente forma:
As = x − Mo 3 ( x − Me) = SX SX

teniendo en cuenta que nunca va a coincidir el valor de ambos resultados, pero si debe coincidir el signo.

________________________________________________________________________________________________________________________ Página 33

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

4º- LA CURTOSIS Y SUS COEFICIENTES
Cuando comparamos una distribución con la normal, nos interesa a veces saber si es más o menos puntiaguda que ésta. Cuando una distribución presenta mayor apuntamiento, se le denomina Leptocúrtica; si presenta un apuntamiento menor, se denomina Platocúrtica, y aquellas distribuciones con un apuntamiento semejante al que presenta la distribución normal se denominan Mesocúrticas.

Leptocúrtica

Mesocúrtica

Platocúrtica

El parámetro que define esta característica se denomina Coeficiente de Apuntamiento o Curtosis y se simboliza como m4 , cuya expresión es:

⎛ 1 m4 = ⎜ ⎜S ⎝ X

⎞ ⎟ ⎟ ⎠

4

∑ (x

i

− x ) ni
4

N

Si m 4 > 3 ⇨ Leptocúrtica Si m 4 = 3 ⇨ Mesocúrtica Si m 4 < 3 ⇨ Platocúrtica • Para distribuciones del tipo II y III, y desarrollando la expresión anterior:
⎛ 1 m4 = ⎜ ⎜S ⎝ X ⎞ ⎟ ⎟ ⎠
4

⎡ x4n x3n xn x 2n ⎢∑ i i − 4 ⋅ ∑ i i ⋅ ∑ i i + 6 ⋅ ∑ i i N N N ⎢ N ⎣

⎛ ∑ xi ni ⎜ ⎜ N ⎝

⎞ ⎛ xn ⎟ − 3⋅⎜ ∑ i i ⎟ ⎜ N ⎠ ⎝
2

⎞ ⎟ ⎟ ⎠

4

⎤ ⎥ ⎥ ⎦

• Para distribuciones del tipo II y III, y aplicando el cambio de escala o de origen, la expresión sería la siguiente:
⎛ a m4 = ⎜ ⎜S ⎝ X ⎞ ⎟ ⎟ ⎠
4

⎡ d 4n d 3n dn d 2n ⎢∑ i i − 4 ⋅ ∑ i i ⋅ ∑ i i + 6 ⋅ ∑ i i N N N ⎢ N ⎣

⎛ ∑ d i ni ⎜ ⎜ N ⎝

⎛ dn ⎞ ⎟ − 3⋅⎜ ∑ i i ⎜ N ⎟ ⎝ ⎠
2

⎞ ⎟ ⎟ ⎠

4

⎤ ⎥ ⎥ ⎦

________________________________________________________________________________________________________________________ Página 34

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Ejemplo A, del 1º caso: xi 10 12 14 16 ni 4 3 2 1 10
i

x i ni

(xi − x ) (xi − x )2
-2 0 2 4 4 0 4 16

(xi − x )2 ni (xi − x )3 ni (xi − x )4 ni
16 0 8 16 40 - 32 0 16 64 48 64 0 32 256 352

40 36 28 16 120

∑x x=

ni

N

120 ∑ (xi − x ) ni = 40 = 4 ⇒ S = 4 = 2 2 = = 12 ⇨ S X = X N 10 10
2

⎛ 1 m3 = ⎜ ⎜S ⎝ X ⎛ 1 m4 = ⎜ ⎜S ⎝ X

⎞ ⎟ ⎟ ⎠ ⎞ ⎟ ⎟ ⎠

3

∑ (x

i

− x ) ni
3

N
4

⎛ 1 ⎞ 48 = ⎜ ⎟ ⋅ = 0,6 ⇒ Asimetría Positiva ⎝ 2 ⎠ 10 ⎛ 1 ⎞ 352 = 2,2 ⇒ Platocúrtica =⎜ ⎟ ⋅ ⎝ 2 ⎠ 10
4

3

∑ (x

i

− x ) ni
4

N

Ejemplo B, del 1º caso: xi 4 9 13 19 26 ni 3 4 9 7 2 25
i

x i ni

(xi − x ) (xi − x )2
- 10 -5 -1 5 12 100 25 1 25 144

(xi − x )2 ni (xi − x )3 ni (xi − x )4 ni
300 100 9 175 288 872 - 3.000 - 500 -9 875 3.456 822 30.000 2.500 9 4.375 41.472 78.356

12 36 117 133 52 350

∑x x=

ni

N

350 ∑ (xi − x ) ni = 872 = 34,88 ⇒ S = 34,88 = 5,9 2 = = 14 ⇨ S X = X N 25 25
2

⎛ 1 m3 = ⎜ ⎜S ⎝ X ⎛ 1 m4 = ⎜ ⎜S ⎝ X

⎞ ⎟ ⎟ ⎠ ⎞ ⎟ ⎟ ⎠

3

∑ (x

i

− x ) ni
3

N
4

⎛ 1 ⎞ 822 =⎜ = 0,16 ⇒ Asimetría Positiva ⎟ ⋅ ⎝ 5,9 ⎠ 25 ⎛ 1 ⎞ 78.356 =⎜ = 2,58 ⇒ Platocúrtica ⎟ ⋅ 25 ⎝ 5,9 ⎠
4

3

∑ (x

i

− x ) ni
4

N

________________________________________________________________________________________________________________________ Página 35

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Ejemplo, del 2º caso: xi 10 12 14 16 ni 4 3 2 1 10
x i ni xi2 ni xi3 ni xi4 ni

40 36 28 16 120

400 432 392 256 1.480

4.000 5.184 5.488 4.096 18.768

40.000 62.208 76.832 65.536 244.576

x=

∑x

i

ni

N

=

120 = 12 10

2 SX

∑x n =
N ⎞ ⎟ ⎟ ⎠
3

2 i i

⎛ ∑ xi ni −⎜ ⎜ N ⎝

⎞ 1.480 ⎛ 120 ⎞ 2 ⎟ = −⎜ ⎟ = 4 ⇒ SX = 4 = 2 ⎟ 10 ⎝ 10 ⎠ ⎠ ⎞ ⎟ ⎟ ⎠
3

2

⎛ 1 m3 = ⎜ ⎜S ⎝ X

⎡ x3n ⎛ xn xn x2n ⎢∑ i i − 3⋅ ∑ i i ⋅ ∑ i i + 2 ⋅⎜ ∑ i i ⎜ N N N ⎢ N ⎝ ⎣

⎤ ⎥= ⎥ ⎦

⎛1⎞ =⎜ ⎟ ⎝2⎠

3

3 ⎡18.768 120 1.480 ⎛ 120 ⎞ ⎤ − 3⋅ ⋅ + 2⋅⎜ ⎟ ⎥ = 0,6 ⇒ Asimetría Positiva ⎢ 10 10 ⎝ 10 ⎠ ⎥ ⎢ 10 ⎣ ⎦

⎛ 1 m4 = ⎜ ⎜S ⎝ X

⎞ ⎟ ⎟ ⎠

4

⎡ x4n x 3n xn x2n ⎢∑ i i − 4⋅ ∑ i i ⋅ ∑ i i + 6⋅ ∑ i i N N N ⎢ N ⎣

⎛ ∑ xi ni ⎜ ⎜ N ⎝

⎛ xn ⎞ ⎟ − 3⋅⎜ ∑ i i ⎜ N ⎟ ⎝ ⎠
2

⎞ ⎟ ⎟ ⎠

4

⎤ ⎥= ⎥ ⎦

⎛1⎞ =⎜ ⎟ ⎝2⎠

4

2 4 ⎡ 244.576 18.768 120 1.480 ⎛ 120 ⎞ ⎛ 120 ⎞ ⎤ − 4⋅ ⋅ + 6⋅ ⎟ ⎥ = 2,2 ⇒ Platocúrtica ⎜ ⎟ − 3⋅⎜ ⎢ 10 10 10 ⎝ 10 ⎠ ⎝ 10 ⎠ ⎥ ⎢ 10 ⎣ ⎦

________________________________________________________________________________________________________________________ Página 36

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Ejemplo, del 3º caso: L i-1 - L i 0-50 50-100 100-150 150-200 200-250 xi 25 75 125 175 225 ni 30 40 90 70 20 250
di d i ni d i2 ni d i3 ni d i4 ni
Ni

hi =

ni ai

-2 -1 0 1 2

- 60 - 40 0 70 40 10

120 40 0 70 80 310

- 240 - 40 0 70 160 -50

480 40 0 70 320 910

30 70 160 230 250

0,6 0,8 1,8 1,4 0,4

di =

xi − O X xi − 125 = 50 a

a) Media ⇨ x = O X +

∑d n
N

i i

⎛ 10 ⎞ ⋅ ai = 125 + ⎜ ⎟ ⋅ 50 = 127 ⎝ 250 ⎠

N − N i −1 (127 − 70) ⋅ 50 = 130,55 N 250 2 b) Mediana ⇨ ai = 100 + = = 125 ⇒ Me = Li −1 + ni 90 2 2
c) Moda ⇨ Mo = Li −1 +

hi +1 1,4 ai = 100 ⋅ ⋅ 50 = 131,81 1,4 + 0,8 hi +1 + hi −1

d) Varianza y Desviación Típica ⇨

⎡ d 2n ⎛ d n ∑ i i −⎜ ∑ i i S =a ⎢ ⎜ N ⎢ N ⎝ ⎣
2 X 2

⎞ ⎟ ⎟ ⎠

2

⎤ ⎡ 310 ⎛ 10 ⎞ 2 ⎤ ⎥ = 50 2 ⎢ −⎜ ⎟ ⎥ = 3.096 ⇒ S X = 3.096 = 55,64 ⎥ ⎢ 250 ⎝ 250 ⎠ ⎥ ⎣ ⎦ ⎦ SX 55,64 ⋅100 = ⋅100 = 43,81% 127 x

e) Coeficiente de Variación ⇨ Cv = f) Asimetría de Pearson ⇨

As =

x − Mo 127 − 131,81 = = − 0,086 55,64 SX

As =

3 ( x − Me ) 3 (127 − 130,55) = = − 0,19 SX 55,64

________________________________________________________________________________________________________________________ Página 37

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

g) Asimetría de Fisher ⇨

⎛ a m3 = ⎜ ⎜S ⎝ X

⎞ ⎟ ⎟ ⎠
3

3

⎡ d 3n ⎛ dn dn d 2n ⎢∑ i i − 3⋅ ∑ i i ⋅ ∑ i i + 2 ⋅⎜ ∑ i i ⎜ N N N ⎢ N ⎝ ⎣

⎞ ⎟ ⎟ ⎠

3

⎤ ⎥= ⎥ ⎦

⎛ 50 ⎞ =⎜ ⎟ ⎝ 55,64 ⎠

3 ⎡ − 50 10 310 ⎛ 10 ⎞ ⎤ − 3⋅ ⋅ + 2⋅⎜ ⎟ ⎥ = − 0,253 ⇒ Asimetría Negativa ⎢ 250 250 ⎝ 250 ⎠ ⎥ ⎢ 250 ⎦ ⎣

h) Asimetría de Pearson ⇨

⎛ a m4 = ⎜ ⎜S ⎝ X

⎞ ⎟ ⎟ ⎠
4

4

⎡ d 4n ∑ i i − 4 ⋅ ∑ d i3 ni ⋅ ∑ d i ni + 6 ⋅ ∑ d i2 ni ⎛ ∑ d i ni ⎜ ⎢ N N N ⎜ N ⎢ N ⎝ ⎣

⎞ ⎛ dn ⎟ − 3⋅⎜ ∑ i i ⎟ ⎜ N ⎠ ⎝
2

⎞ ⎟ ⎟ ⎠

4

⎤ ⎥= ⎥ ⎦

⎛ 50 ⎞ =⎜ ⎟ ⎝ 55,64 ⎠

2 4 ⎡ 910 − 50 10 310 ⎛ 10 ⎞ ⎛ 10 ⎞ ⎤ − 4⋅ ⋅ + 6⋅ ⎟ ⎥ = 2,4 ⇒ Platocútica ⎟ − 3⋅⎜ ⎜ ⎢ 250 250 250 ⎝ 250 ⎠ ⎝ 250 ⎠ ⎥ ⎢ 250 ⎣ ⎦

________________________________________________________________________________________________________________________ Página 38

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

TEMA 6º - MEDIDAS DE CONCENTRACIÓN
La dispersión se definía, como el grado de alejamiento o separación respecto de la media, de los casos u observaciones de una variable estadística. El término concentración no debe considerarse como opuesto al de dispersión desde el punto de vista de la estadística. Por eso cuando se habla de concentración, se entiende la mayor o menor igualdad de reparto de una determinada magnitud, por ejemplo, la renta, los salarios, las ventas, etc. Es decir, el término concentración tiene un significado opuesto al término reparto igualitario.

1º- CURVA DE CONCENTRACIÓN O DE “LORENZ”
Supongamos una empresa, en la que queremos estudiar el comportamiento de los salarios. Para conocer el grado de desigualdad existente en las retribuciones de los mismos, podríamos establecer la siguiente tabla:
(1) Salarios 0,5 – 1,5 1,5 – 2,5 2,5 – 3,5 3,5 – 4,5 4,5 – 5,5 5,5 – 6,5 6,5 – 7,5 (2) xi 1 2 3 4 5 6 7 (3) ni 5 14 15 7 4 3 2 50 (4) x i ni 5 28 45 28 20 18 14 158 (5) % ni 10 28 30 14 8 6 4 (6) % xi ni 3,16 17,72 28,84 17,72 12.66 11,40 8,86 (7) pi 10 38 68 82 90 96 100 384 (8) qi 3,16 20,88 49,36 67,08 79,74 91,14 100 (9) p i − qi 6,84 17,12 18,64 14,92 10,26 4.86 ⇨ k - 1 0 72,64

(1) Salario Semanal en miles de u.m. (2) Marca de clase. (3) Nº de obreros. (4) Volumen de salarios. (5) Nº de obreros en porcentaje. (6) Volumen de salarios en porcentaje. (7) Porcentaje acumulado de obreros. (8) Porcentaje acumulado de volumen de salarios. (9) = (7) – (8)

Si ponemos en relación las columnas (7) y (8), obtenemos una información que nos indica el “reparto” de los salarios, poniendo de relieve la concentración de los mismos. En efecto, ordenados los salarios de los trabajadores de mayor a menor, resulta que el 10% de los trabajadores se reparte el 3,16% del total de los salarios de la empresa; el 38% de los trabajadores recibe solamente el 20,88% del total de los salarios; el 68% solo el 49,36%, etc.

________________________________________________________________________________________________________________________ Página 39

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Si la distribución fuese igualitaria (Equidistribución), el 10% de los trabajadores percibiría el 10% del salario, el 38% debería repartirse el 38% del total, etc. La Curva de Lorenz es un indicador de la concentración (mayor o menor igualdad en el reparto). Si la Curva de Lorenz está cerca de la diagonal nos indica “poca concentración”, a medida que se aleja de la diagonal, la “concentración es mayor”.

Por tanto se pueden presentar dos casos extremos: a) Área = 0,5 (reparto no equitativo)

Mínima Igualdad = Máxima concentración

b) Área = 0 (reparto equitativo)

Máxima Igualdad = Mínima concentración

________________________________________________________________________________________________________________________ Página 40

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

2º- INDICE DE CONCENTRACIÓN O DE “GINI”

Viene dado por la siguiente expresión: Ig =

∑(p
i =1 i =1

k −1

i

− qi )
i

∑p

k −1

Es decir, que el Indice de Gini, mide la concentración, por medio de las diferencias existentes entre los pi y los qi . Téngase en cuenta que el sumatorio se extiende hasta:
k − 1 , ya que el último valor p K = q K = 100 y por tanto p K − q K = 0 .

El Indice de Gini puede tomar dos valores extremos: 1º) Si existe “concentración nula” (Ig = 0), es por que todos los individuos reciben la misma cantidad, por tanto, se verifica que pi = qi , consiguientemente pi − qi = 0 , y el Ig = 0. (Los individuos tienen el mismo grado de riqueza y el reparto es equitativo).
Ig =

∑(p
i =1 i =1

k −1

i

− qi )
i

∑p

k −1

=0

2º) Si existe “máxima concentración” (Ig = 1), es por que el total de los salarios está en manos de un solo individuo, por tanto: q1 = q2 = ...... = q K −1 = 0
Ig =

∑ ( p i − qi ) ∑ pi
i =1

k −1

k −1 i =1 k −1 i =1

∑p
i =1

k −1

=

i

∑p

=1

i

Así pues, a medida que el Indice de Gini se aproxima a 0, indicará una “menor concentración” (máxima igualdad en el reparto), mientras que cuanto más se aproxime a 1, reflejará una “mayor concentración” (mínima igualdad o reparto no equitativo). En el ejemplo que estamos estudiando el Indice de Gini será:

Ig =

∑(p
i =1 i =1

k −1

i

− qi )
i

∑p

k −1

=

72,64 = 0,189 ⇒ Concentración no muy fuerte 384 Ig 0,189 = = 0,094 2 2

El área valdrá : AT =

________________________________________________________________________________________________________________________ Página 41

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: los salarios mensuales (en miles de u.m.) de los trabajadores de un hotel, son los siguientes:
Salarios 10 - 20 20 - 30 30 - 40 40 - 50

xi
15 25 40 60

ni
40 30 20 10 100
− qi )
i

x i ni
600 750 800 600 2.750

% ni

% xi ni

pi
40 70 90 100 200

qi
21,818 49,09 78,18 100

p i − qi
18,182 20,91 11,82 0 50,912

40 30 20 10

21,818 27,272 29,09 21,818

Ig =

∑(p
i =1 i =1

k −1

i

∑p

k −1

=

50,912 = 0,254 ⇒ Concentración no muy fuerte 200 Ig 0,254 = = 0,127 2 2

El área valdrá : AT =

________________________________________________________________________________________________________________________ Página 42

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

TEMA 7º - SERIES ESTADISTICAS DE DOS VARIBLES
1º- DEFINICION Y TIPOS DE SERIES
En los temas anteriores hemos visto diferentes conceptos, pero siempre referidos al estudio de una sola variable; en este tema vamos a estudiar conjuntamente dos caracteres cuantitativos de una población. Nos encontramos ante estadísticas de dos variables. Frecuentemente se nos presentan dos variables que, sin estar ligadas entre si por una relación matemática, tienen una cierta dependencia estadística; ejemplo: altura y peso; población de una ciudad y número de escuelas; demanda turística y establecimientos hoteleros, etc. En estadísticas de una sola variable, definimos la frecuencia absoluta como el número de veces que se repite el valor de una variable; en series estadísticas de dos variables, las veces que se repite cada pareja de valores recibe el nombre de frecuencia absoluta conjunta. Las distribuciones de frecuencias de dos variables las podemos clasificar, asimismo, en:

• •

Distribuciones de tipo I, donde algunos valores de la variable X puede repetirse, pero con distinto valor de la variable Y, y viceversa. Distribuciones de tipo II, donde los valores de estas variables vienen acompañadas de sus frecuencias; también aquí algunos valores de X puede repetirse, pero con distinto valor de Y, y viceversa. xi x1 x2 x3 . . xn yj y1 y2 y3 . . yn xi x1 x2 x3 . . xn yj y1 y2 y3 . . yn Tipo II

ni

j

n 11 n 12 n 13 . . n 1k

Tipo I

________________________________________________________________________________________________________________________ Página 43

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Distribuciones de tipo III, en las cuales los datos se suelen presentar en tablas de doble entrada, donde en la primera fila se colocan los valores de la variable X, y en la primera columna se colocan los valores de la variable Y; en la confluencia de la columna x i con la fila de y j se coloca la frecuencia conjunta ni j. Esta tabla se completa frecuentemente con una última fila, que recoge el sumatorio de cada columna; y con una última columna, donde recoge el sumatorio de cada fila.
xi y1 y2 y3 . . . yk Totales x1 n 11 n 12 n 13 . . . n 1k ∑ x2 n 21 n 22 n 23 . . . n 2k ∑ x3 n 31 n 32 n 33 . . . n 3k ∑ ……… ……… ……… ……… . . . ……… ……… xn n n1 n n2 n n3 . . . n nk ∑ N Totales ∑ ∑ ∑ . . .

yj

2º- DISTRIBUCIONES MARGINALES: MEDIAS, VARIANZAS Y DESVIACION TIPICA
Las distribuciones formadas por las columnas primera y última, por un lado, y por la primera fila y la última fila, por otro, reciben el nombre de distribuciones marginales. Son distribuciones de cada una de las variables consideradas por separado sin tener en cuenta los valores de la otra. Distribución marginal de X xi ni j x1 x2 x3 . . xn n 11 n 12 n 13 . .. n 1k Distribución marginal de Y yj ni j y1 y2 y3 . . yn n 11 n 12 n 13 . . n 1k

________________________________________________________________________________________________________________________ Página 44

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: Calcula la media, varianza y desviación típica marginales de la variable X y de la variable Y, respectivamente.
xi yj 10 5 3 Totales 2 4 1 2 7 4 3 3 2 8 6 2 1 1 4 Totales 9 5 5 19

1. Distribución marginal de X

xi
2 4 6

nij
7 8 4 19

xi nij
14 32 24 70

xi2 nij
28 128 144 300

x=

∑x

i

nij

N

=

70 = 3,68 19
2 ⎞ ⎟ = 300 − ⎛ 70 ⎞ = 2,216 ⇒ S X = 2,216 = 1,488 ⎜ ⎟ ⎟ 19 ⎝ 19 ⎠ ⎠ 2

S

2 X

∑x n =
N

2 i ij

⎛ ∑ xi nij −⎜ ⎜ N ⎝

2. Distribución marginal de Y

yj
10 5 3

nij
9 5 5 19

y j nij
90 25 15 130

y 2 nij j
900 125 45 1.070

y=

∑y

j

nij

N
2 j ij

=

130 = 6,84 19 ⎞ 1.070 ⎛ 130 ⎞ 2 ⎟ = −⎜ ⎟ = 9,5 ⇒ SY = 9,5 = 3,08 ⎟ 19 ⎝ 19 ⎠ ⎠
2

S

2 Y

∑y =

n

N

⎛ ∑ y j nij −⎜ ⎜ N ⎝

________________________________________________________________________________________________________________________ Página 45

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

3º- DEPENDENCIA FUNCIONAL O EXACTA Y DEPENDENCIA ESTADISTICA. COVARIANZA
Cuando estudiamos la relación existente entre dos variables, nos podemos encontrar:
a) Con fenómenos totalmente independientes entre sí; por ejemplo, si la variable X representa el «peso» de un conjunto de personas, y la variable Y el «nivel intelectual» de las mismas, sabemos de antemano que ambos fenómenos son absolutamente independientes y, por tanto, no existe ninguna relación entre ellos. b) Con fenómenos en que la relación existente entre las dos variables tiene una dependencia funcional o exacta; para cada valor de la variable X existe un solo valor de la variable Y. Es decir, las dos variables estén relacionadas por una función matemática; por ejemplo, masa de un cuerpo y gravedad del mismo. c) Con fenómenos en que la relación existente entre las dos variables tiene una dependencia estadística; para cada valor de la variable independiente existen distintos valores de la variable dependiente; por ejemplo, si estudiamos demanda turística y establecimientos hoteleros, vemos a priori que existe una relación entre las dos variables, y que dicha dependencia no es funcional o exacta, sino que estamos ante una dependencia estadística.

Por la simple observación de la nube de puntos resultante de representar la variable X y la variable Y, podemos observar el tipo de dependencia existente entre las dos variables. Si la representación gráfica da lugar a una serie de puntos que unidos por una línea da lugar a la expresión gráfica de una función matemática, estaremos ante una dependencia exacta entre las dos variables. Si lo que obtenemos es una nube de puntos de forma alargada, y de inclinación positiva, la dependencia estadística será de tipo lineal y recta; si la inclinación es negativa, la dependencia estadística será de tipo lineal e inverso; si la nube de puntos presenta forma parabólica, la dependencia vendrá dada por una función parabólica; si la nube de puntos no presenta ninguna forma, diremos que las variables son independientes entre si, están «incorrelacionadas».

________________________________________________________________________________________________________________________ Página 46

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

El parámetro matemático que estudia la dependencia estadística entre las dos variables se denomina Covarianza. La Covarianza, se define como la media aritmética de los productos de las desviaciones de cada una de las variables con respecto a su media aritmética.

Para distribuciones del tipo I:

S XY =

∑ ∑ (x
i =1 j =1

h

k

i

− x )( y j − y ) N

Para distribuciones del tipo II y III:

∑ ∑ (x
S XY =
i =1 j =1

h

k

i

− x )( y j − y ) nij N

Para el cálculo, estas fórmulas se presentan de una forma más práctica, de la siguiente forma:

Para distribuciones del tipo I:

S XY =

∑ ∑x y
i =1 j =1 i

h

k

j

N

∑ xi
i =1

h

N

∑y
j =1

k

j

N

Para distribuciones del tipo II y III:

S XY =

∑ ∑x y n
i =1 j =1 i j

h

k

ij

N

∑ xi nij
i =1

h

N

∑y n
j =1 j

k

ij

N

= xy − x ⋅ y

En la Covarianza se pueden presentar tres casos:

• • •

S XY = 0 ⇨ No existe dependencia estadística. S XY > 0 ⇨ Dependencia estadística de tipo directo. S XY < 0 ⇨ Dependencia estadística de tipo inverso.

________________________________________________________________________________________________________________________ Página 47

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: Calcula la media, varianza y desviación típica de las variables X y de la variable Y, y la Covarianza.
xi yj 10 5 3 Totales 2 4 1 2 7 4 3 3 2 8 6 2 1 1 4 Totales 9 5 5 19

xi
2 4 6 2 4 6 2 4 6

yj
10 10 10 5 5 5 3 3 3

nij
4 3 2 1 3 1 2 2 1 19

xi nij
8 12 12 2 12 6 4 8 6 70

xi2 nij

y j nij
40 30 20 5 15 5 6 6 3 130

y 2 nij j

xi y j nij

16 48 72 4 48 36 8 32 36 300

400 300 200 25 75 25 18 18 9 1.070

80 120 120 10 60 30 12 24 18 474

x=

∑x

i

nij

N

=

70 = 3,68 19
2 ⎞ ⎟ = 300 − ⎛ 70 ⎞ = 2,216 ⇒ S X = 2,216 = 1,488 ⎜ ⎟ ⎟ 19 ⎝ 19 ⎠ ⎠ 2

S

2 X

∑x n =
N
j

2 i ij

⎛ ∑ xi nij −⎜ ⎜ N ⎝ =

y=

∑y

nij

N
2 j ij

130 = 6,84 19 ⎞ 1.070 ⎛ 130 ⎞ 2 ⎟ = −⎜ ⎟ = 9,5 ⇒ SY = 9,5 = 3,08 ⎟ 19 ⎝ 19 ⎠ ⎠
2

S

2 Y

∑y =
h

n

N
k

⎛ ∑ y j nij −⎜ ⎜ N ⎝
h

N N N ⇒ Dependendia Lineal Inversa

S XY =

∑ ∑x y n
i =1 j =1 i j

ij

∑ xi nij
i =1

∑y n
j =1 j

k

ij

=

474 70 130 − ⋅ = −0,26 ⇒ 19 19 19

________________________________________________________________________________________________________________________ Página 48

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

TEMA 8º - AJUSTE Y REGRESIÓN DE DOS VARIBLES
1º- CONCEPTOS DE AJUSTE Y REGRESIÓN
Cuando dos variables están ligadas por una ecuación matemática, decimos que entre ellas hay una «relación funcional» y cuando hay una relación estadística afirmamos que hay una «correlación». El parámetro estadístico que medía la dependencia existente entre las dos variables lo definimos «covarianza». En este tema vamos, a considerar aquellos fenómenos en los que la dependencia existente entre ambas variables es una «dependencia estadística». Como ya indicamos, si representamos gráficamente la variación conjunta de las dos variables, entre las que existe una correlación, nos da una nube de puntos o diagrama de dispersión con una cierta tendencia a agruparse más o menos y de uno u otro modo. A partir de aquí, vamos a establecer una «línea de regresión», que va a ser una especie de línea media que discurre por el centro de la nube de puntos.

Por tanto, el concepto de «ajuste» lo podemos definir como la sustitución de la dependencia de tipo estadístico existente entre dos variables por una dependencia de tipo funcional o exacto, que implica la determinación de los parámetros que caracterizan a tal función analítica. El concepto de «regresión» es paralelo al concepto de ajuste, de forma que en general hablamos de rectas de regresión y, en general, de líneas de regresión.

________________________________________________________________________________________________________________________ Página 49

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

2º- UTILIZACION PRACTICA DE LA NUBE DE PUNTOS PARA DETERMINAR EL TIPO DE DEPENDENCIA ESTADISTICA
La simple observación de la nube de puntos o diagrama de dispersión indica el tipo de dependencia estadística existente entre dos variables. Así, si la nube de puntos presenta una forma alargada y de inclinación positiva, deducimos que existe una dependencia lineal y positiva; si la inclinación fuese negativa, la dependencia seria inversa; si el diagrama no presentase ninguna forma, estaríamos ante dos variables independientes entre si, etc. Aunque parezca un método «simple», a partir de aquí podemos elegir el tipo de función matemática que mejor se ajusta a la dependencia estadística existente entre las dos variables.

3º- EL METODO DE LOS MINIMOS CUADRADOS ORDINARIOS
De los diferentes métodos de ajuste existentes para sustituir una nube de puntos por una función matemática, trataremos del más usual, denominado «Método de los Mínimos Cuadrados Ordinarios» (MMCO). Vamos a considerar exclusivamente el ajuste de una nube de puntos a una recta, aunque este método es extensivo a cualquier función matemática. Dicho método se basa en la condición de que sea mínima la suma de los cuadrados de las diferencias entre los valores observados y los valores ajustados, es decir:

∑ (y

i

− yi*

)

2

= Mínimo

donde yi son los valores observados e yi* , los valores ajustados. La diferencia entre los valores observados ( yi ) y los valores ajustados ( yi* ) se denomina error o residuo, ei ; por tanto, el método de los mínimos cuadrados ordinarios se basa en que:

∑ (y

i

− yi*

) =∑ e
2

2 i

= Mínimo

Si lo que se quiere es ajustar la nube de puntos a una recta del tipo yi* = a + b xi , a partir de esta expresión y mediante un tratamiento matemático llegamos al «sistema de ecuaciones normales».
f a, b = ∑ yi − (a + b x)

(

)

[

]

2

= Mínimo

________________________________________________________________________________________________________________________ Página 50

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

A continuación, minimizamos esta expresión. mediante la igualación a cero de sus derivadas con respecto a a y b. Por tanto. queda:
d f d a d f d b
= 2∑ ( y − a − bx ) ⋅ (− 1) = 0

∑y
i

j

= aN + b∑ xi = a ∑ x i + b∑ xi2

= 2∑ ( y − a − bx ) ⋅ (− x ) = 0 ⇒

∑x y

j

Estas ecuaciones reciben el nombre de ecuaciones normales, y el parámetro b (pendiente de la recta de regresión) recibe el nombre de «coeficiente de regresión» de la variable y con respecto a la variable x e indica en cuánto variará y cuando x varíe en una unidad. Tenemos entonces, tres métodos, para calcular los parámetros o coeficientes de la recta de regresión yi* = a + b xi : 1. Del MMCO, y para distribuciones tipo II y III, llegamos al sistema de ecuaciones normales:

∑ y n = aN + b∑ x n ∑ x y n = a ∑ x n + b∑ x n
j ij i ij

i

j

ij

i ij

2 i ij

2. Despejando del método anterior:
yi* = a + b xi ⇒ b =

S XY 2 SX a = y − bx S XY 2 SY

xi* = a ' + b ' yi ⇒ b' =

a ' = x − b' y

3. Mediante las Rectas de Regresión (ecuaciones de la recta que pasan por dos puntos):
Y X X Y ⇒

(y − y)

= b (x − x )

⇒ (x − x ) = b' ( y − y )

________________________________________________________________________________________________________________________ Página 51

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: calcular, mediante el MMCO, la recta de regresión de los siguientes valores:
xi
3 3 5 6 7 7 9 9

yj
3 5 5 6 6 7 8 10

nij
2 4 8 9 7 5 3 2 40

xi nij
6 12 40 54 49 35 27 18 241

xi2 nij

y j nij
6 20 40 54 42 35 24 20 241

y 2 nij j

xi y j nij

18 36 200 324 343 245 243 162 1.571

18 100 200 324 252 245 192 200 1.531

18 60 200 324 294 245 216 180 1.537

x=

∑x

i

nij

N

=

241 = 6,025 40

S

2 X

∑x n =
N
j

2 i ij

y= S
2 Y

∑y

⎛ ∑ xi nij −⎜ ⎜ N ⎝ =

⎞ 1.571 ⎛ 241 ⎞ 2 ⎟ = −⎜ ⎟ = 2,974 ⇒ S X = 2,974 = 1,724 ⎟ 40 ⎝ 40 ⎠ ⎠

2

nij
2 j ij

N n N
k j =1

241 = 6,025 40

∑y =

i =1 h

⎛ ∑ y j nij −⎜ ⎜ N ⎝
h

⎞ 1.531 ⎛ 241 ⎞ 2 ⎟ = −⎜ ⎟ = 1,974 ⇒ SY = 1,974 = 1,405 ⎟ 40 ⎝ 40 ⎠ ⎠

2

N N N ⇒ Dependendia Lineal Directa

S XY =

∑ xi y j nij

∑ xi nij
i =1

∑y n
j =1 j

k

ij

=

1.537 241 241 − ⋅ = 2,124 ⇒ 40 40 40

1. Por los MCCO:

∑ y n = aN + b∑ x n ∑ x y n = a ∑ x n + b∑ x n
j ij i ij

⇒ 241 = 40 a + 241 b ⇒ a = 1,724 ⇒ 1.537 = 241 a + 1.571 b ⇒ b = 0,714

i

j

ij

i ij

2 i ij

yi* = a + b xi

⇒ y * = 1,724 + 0,714 x i i

2. Despejando del método anterior:
yi* = a + b xi ⇒ b =

a = y − b x = 6,025 − (0,714 ) ⋅ 6,025 = 1,723

S XY 2,124 = = 0,714 2 SX 2,974

________________________________________________________________________________________________________________________ Página 52

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: Ajustar una parábola de 2º grado, por el MMCO.
xi
1 2 3 4 5

yj
1 1 2 2 5

nij
3 5 6 4 2 20

xi nij
3 10 18 16 10 57

xi2 nij

xi3nij

xi4 nij

y j nij
3 5 12 8 10 38

xi y j nij

xi2 y j nij

3 20 54 64 50 191

3 40 162 256 250 711

3 80 486 1.024 1.250 2.843

3 10 36 32 50 131

3 20 108 128 250 509

yi* = a + b xi + c xi2

∑y n
i

j ij

= aN + b∑ xi nij + c ∑ xi2 nij = a ∑ xi nij + b∑ xi2 nij + c ∑ xi3nij
2

∑x y n ∑x
2 i

j ij

y j nij = a ∑ x i nij + b∑ xi3nij + c ∑ xi4 nij

38 = 20a + 57b + 191c ⇒ a = 1,7197 131 = 57 a + 191b + 711c ⇒ b = −0,9231 509 = 191a + 711b + 2.843c ⇒ c = 0,29435

yi* = a + b xi + c xi2 = 1,7197 − 0,9231x + 0,29435 x 2

________________________________________________________________________________________________________________________ Página 53

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: Ajustar una hipérbola equilátera, por el MMCO.
xi
10 12 15 18 20 25 30

yj
2,0 1,6 1,5 1,2 1,0 0,8 0,3 8,4

1 xi
0,1000 0,0833 0,0667 0,0556 0,0500 0,0400 0,0333 0,4289

1 xi2
0,0100 0,0069 0,0044 0,0031 0,0025 0,0016 0,0011 0,0297

yj xi 0,2000 0,1333 0,1000 0,0667 0,0500 0,0320 0,0100 0,5920

yi* = a + b ⋅

1 xi

∑y n ∑x
yj
i

j ij

= aN + b∑

1 ⋅ nij xi

⋅ nij = a ∑

1 1 ⋅ nij + b∑ 2 ⋅ nij xi xi

8,4 = 7 a + 0,4289b ⇒ a = − 0,1849

0,592 = 0,4289a + 0,0297b ⇒ b = 22,6036 1 22,6036 = −0,1849 + xi xi

yi* = a + b ⋅

________________________________________________________________________________________________________________________ Página 54

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: Ajustar a una función exponencial, la siguiente serie estadística, por el MMCO.
xi
1,6 1,7 2,0 2,1 2,2 2,5 2,6 14,7

yj
2,0 2,1 2,4 2,4 2,5 2,8 3,0

xi2 2,56 2,89 4,00 4,41 4,84 6,25 6,76 31,71

T
0,693147 0,741937 0,875469 0,875469 0,916291 1,029619 1,098612 6,230544

xi ⋅ T
1,10904 1,26129 1,75094 1,83848 2,01584 2,57405 2,85639 13,40603

yi* = a ⋅ ebxi

yi* = a ⋅ ebxi ⇒ Ln y = Ln a ⋅ ebx
Ln y = T Ln a = A Ln e = 1

(

)

⇒ Ln y = Ln a + Ln ebx ⇒ Ln y = Ln a + bx ⋅ Ln e

⇒ T = A+ B X ⇒

∑ T = A ⋅ N + B∑ x ∑ x T = A∑ x + B∑ x
i i i

2 i

6,23 = 7 A + 14,7 B ⇒ A = 0,0975 13,4 = 14,7 A + 31,71B ⇒ B = 0,3773 = b

A = Ln a = 0,0975 ⇒ a = e0,0975 = 1,1024

yi* = a ⋅ ebxi = 1,1024 ⋅ e0,3773 xi

________________________________________________________________________________________________________________________ Página 55

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

TEMA 9º - ANALISIS DE LA CORRELACIÓN
1º- MEDIDAS DE LA DEPENDENCIA ESTADISTICA Y DE LA CORRELACION
En el tema anterior hemos visto cómo podemos calcular una recta de regresión cuando tenemos dos variables de las que conocemos un conjunto de valores y suponemos que existe una dependencia estadística entre ellas. Esta recta de regresión nos va a permitir estimar los valores de la variable dependiente (y) cuando conocemos los de la variable independiente (x), con la cual está correlacionada. Sin embargo, el estudio de la correlación no estaría completo si no conociésemos la fiabilidad del valor estimado mediante la recta de regresión. Así, cuando tenemos dos variables entre las que podemos establecer una relación funcional, si tenemos un valor de una de ellas, no solamente podemos calcular el valor correspondiente de la otra sino que podemos afirmar, sin lugar a dudas, que el valor de la variable calculada es totalmente correcto. Sin embargo, cuando calculamos a partir de la recta de regresión el valor de una variable, ya sabemos que no se trata de un valor exacto sino de una aproximación, pero nos falta por saber la «calidad de esa aproximación». Si dos variables están muy correlacionadas, la aproximación realizada a través de la recta de regresión será buena, pero si entre las variables la correlación es muy débil, la aproximación será mala. Por tanto, para completar todos los objetivos vistos en los temas anteriores, es preciso hallar unos «coeficientes» que indiquen el grado de representatividad o bondad de ajuste de la función matemática ajustada a los datos obtenidos empíricamente por observación.

2º- LA VARIANZA RESIDUAL
Cuando ajustamos la línea de regresión y * a una nube de puntos, vimos que se producía una diferencia entre los valores ajustados y los valores observados, denominándose a esta diferencia error o residuo ei . Por tanto, tenemos que: y j − y* = ei Una vez conocido este concepto, podemos definir la varianza residual como la varianza de la serie de errores o residuos. Se simboliza como Se2 . Con lo cual, la varianza residual, resulta: S

2 e

∑ (y =

j

− y* ) nij
2

N

________________________________________________________________________________________________________________________ Página 56

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

La utilización práctica de esta fórmula no es cómoda, ya que tendríamos que calcular los errores y elevarlos al cuadrado, lo cual es bastante laborioso. Pero a partir de ésta podemos obtener otra fórmula, de mayor interés desde el punto de vista práctico. Partiendo de la definición, aunque podemos llegar a la expresión de la varianza residual correspondiente a diferentes tipos de dependencia, vamos a considerar el caso de la regresión lineal. . Si consideramos la variable x como variable dependiente. • Para distribuciones del tipo I:
S
2 e

∑y =

2 j

− a ∑ y j − b∑ xi y j
N

• Para distribuciones del tipo II y III:
S
2 e

∑y n =

2 j ij

− a ∑ y j nij − b∑ xi y j nij
N

Como es lógico, una varianza residual grande indica que el sumatorio de los errores al cuadrado es elevado, con lo cual la representatividad de la línea de regresión será pequeña, mientras que si obtenemos una varianza residual pequeña, la bondad de ajuste de la función a la nube de puntos será grande. Si este coeficiente fuese cero, estaríamos ante una dependencia perfecta entre las variables x e y, puesto que esto implicaría que ∑ ei2 = 0 , lo cual indica que no existe diferencia entre los valores observados y los ajustados.

3º- RELACION ENTRE LAS VARIANZAS
Podemos decir que «la varianza de los valores observados es igual a la suma de las varianzas de los valores ajustados y de los residuos», Por tanto, tenemos que:
2 2 2 2 S y = S y * + Se2 ⇒ Se2 = S y − S y * 2 2 ⇒ S y * = S y − Se2

Esta relación tiene validez general para cualquier tipo de función analítica ajustada, y precisamente en esta generalidad se fundamenta el coeficiente de determinación y su utilidad en el análisis de la dependencia entre dos variables.

________________________________________________________________________________________________________________________ Página 57

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

4º- EL COEFICIENTE DE DETERMINACION La medida cuantitativa de la bondad o representatividad del ajuste de la función a la nube de puntos nos lo da el «coeficiente de determinación»:
R =
2 2 S y* 2 Sy

=

2 S y − Se2 2 SY

= 1−

Se2 2 Sy

Al ser una medida de tipo abstracto, es susceptible de comparaciones con otras distribuciones bidimensionales. Es un coeficiente que muchas veces se expresa en porcentaje. Vamos a pasar a considerar cuándo este coeficiente toma estos valores extremos y su significación práctica. 1. Este coeficiente será igual a uno cuando la varianza residual sea cero, ya que:
2 Se 0 Si ⇒ S = 0 ⇒ R = 1 − 2 = 1 − 2 = 1 ⇒ Dependencia o Correlación Perfecta Sy Sy

2 e

2

2. Este coeficiente será igual a cero cuando la varianza residual sea igual a la varianza de los valores observados, ya que:
2 Si ⇒ Se2 = S y ⇒ R 2 = 1 −

S2 Se2 = 1 − y = 0 ⇒ Incorrelación 2 2 Sy Sy

Por tanto, podemos concluir que mayor será la bondad de ajuste cuanto más cercano esté el coeficiente de determinación a la unidad; si este coeficiente es igual a 0, no indica una «incorrelación» de la función a la nube de puntos; si fuese este coeficiente igual a 1, nos indica una dependencia exacta. Como hemos indicado anteriormente, es un coeficiente que se presenta frecuentemente en porcentajes, fijándose empíricamente el 75 por 100 como límite inferior para considerar la función representativa del fenómeno en estudio. Para el ajuste lineal el coeficiente de determinación se puede calcular también de la siguiente forma:
R =
2

(S )
xy

2

S ⋅S
2 x

2 y

⇒ 0 ≤ R2 ≤ 1

________________________________________________________________________________________________________________________ Página 58

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por último, la varianza residual, conocido el coeficiente de determinación, también de la siguiente forma:
2 2 Se2 S y − Se 2 2 2 2 2 2 2 2 2 2 R =1− 2 = ⇒ R S y = S y − Se ⇒ Se = S y − R S y = S y 1 − R Sy SY2 2

(

)

5º- EL COEFICIENTE DE CORRELACION LINEAL
El coeficiente de correlación lineal es un coeficiente que sólo se aplica en caso de un ajuste lineal; y se define como el cociente entre la covarianza y el producto de las desviaciones típicas de la variable x y la variable y.
r= S xy S ⋅S
2 x 2 y

=

S xy Sx ⋅ S y

⇒ − 1 ≤ r ≤ +1

Este coeficiente varía entre los valores -1 y + 1; de manera que cuando el coeficiente vale + 1 la correlación es positiva y máxima, es decir, cuando la variable independiente crece, también lo hace la variable dependiente, y viceversa. Cuando el coeficiente vale 0, nos indica una falta de relación entre ambas variables. Si el coeficiente vale - 1, la correlación vuelve a ser máxima, pero negativa, cuando una variable crece, la otra decrece y viceversa. Si el valor de este parámetro está próximo a 1 a - 1, aunque no exista una correlación perfecta, se considera como válida. El coeficiente de correlación lineal es una medida de tipo cualitativo que sólo nos indica el grado de la intensidad de la relación lineal existente entre las dos variables, mientras que el coeficiente de determinación es una medida de tipo cuantitativo que mide el grado de dependencia estadística existente entre ambas variables.

________________________________________________________________________________________________________________________ Página 59

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Cuestiones de estadística de dos variables
Cuestión 1º. Analizadas conjuntamente las variables X, que representa los alumnos matriculados en la UPTC, e Y, número de visitantes del Teatro Romano, de Cartagena, durante cinco años consecutivos, se obtuvo como coeficiente de determinación R2 = 0,87. ¿Puede asegurarse que el número de visitantes del Teatro Romano depende del número de universitarios de la UPTC?
El hecho de que el coeficiente de determinación sea del 87%, que es relativamente elevado, no nos permite asegurar de ningún modo una relación causa-efecto entre las variables estudiadas, debido a la naturaleza de las mismas. El valor del coeficiente se debe únicamente a los datos manejados, siendo el resultado puramente casual. Sólo cuando se sabe que existe una dependencia lógica entre las variables estudiadas es cuando tiene sentido y es eficaz la utilización del coeficiente de determinación. Para variables como las dadas, no tiene ningún sentido su estudio conjunto.

Cuestión 2º. Responder verdadero o falso a las siguientes preguntas sobre series estadísticas de dos variables.
Se ha obtenido como ajuste entre las variables siguientes: número de establecimientos (x) y número de plazas turísticas (y), la siguiente recta de regresión: y = 899 + 67x, con un coeficiente de correlación lineal r = 0,99. a) Como el Coeficiente de Regresión, b = 67, es mayor que cero, la relación estadística es inversa. b) El Coeficiente de Determinación es el cuadrado del Coeficiente de Correlación, R2 = 0,98, cuyo valor, próximo a la unidad, indica alto grado de dependencia entre las dos variables. c) El Coeficiente de Determinación R2, puede variar entre + 1 y - 1, según que la relación estadística sea directa o inversa. d) El signo de los Coeficientes de Regresión Lineal (b) y de Correlación Lineal (r), dependen del signo de la Covarianza. e) El número de plazas que corresponde a 100 establecimientos, aplicando el ajuste realizado, es 7.600, aproximadamente.

Cuestión 3º. Se ha estudiado la correlación lineal existente entre una variable X, que representa los gastos mensuales en publicidad para la promoción de un determinado artículo, y la variable Y, que mide las ventas del mismo en el mes siguiente, y se ha obtenido como coeficiente r = + 0,9. Interprétese el efecto de la publicidad en la venta del artículo.
El signo positivo de r nos indica que entre las variables X e Y existe dependencia lineal de tipo directo, cuanto más se invierta en publicidad, mayores serán las ventas. El coeficiente de determinación es R2 = 0,92 = 0,81, que en términos de porcentaje es el 81%, lo que indica que el 81% de los clientes que han comprado el artículo lo han hecho debido a la publicidad, mientras que el 19% restante lo han hecho por otras causas.

________________________________________________________________________________________________________________________ Página 60

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

xi
3 3 5 6 7 7 9 9

yj
3 5 5 6 6 7 8 10

nij
2 4 8 9 7 5 3 2 40
i

xi nij
6 12 40 54 49 35 27 18 241

xi2 nij
18 36 200 324 343 245 243 162 1.571

y j nij
6 20 40 54 42 35 24 20 241

y 2 nij j
18 100 200 324 252 245 192 200 1.531

xi y j nij y * = a + b xi
18 60 200 324 294 245 216 180 1.537 3,866 3,866 5,295 6,008 6,722 6,722 8,150 8,150

y j − y*

(y

j

− y*

) (y
2

j

− y * nij

)

2

- 0,866 1.134 - 0,294 - 0,008 - 0,722 0,278 - 0,150 1,85

0,750 1,286 0,086 0 0,521 0,077 0,023 3,423

1,500 5,144 0,691 0 3,649 0,386 0,068 6,845 18,283

x=

∑x

nij

N

=

241 = 6,025 40

S

2 X

∑x n =
N
j

2 i ij

y= S
2 Y

∑y

⎛ ∑ xi nij −⎜ ⎜ N ⎝ =

⎞ 1.571 ⎛ 241 ⎞ 2 ⎟ = −⎜ ⎟ = 2,974 ⇒ S X = 2,974 = 1,724 ⎟ 40 ⎝ 40 ⎠ ⎠

2

nij
2 j ij

N n

241 = 6,025 40
2

∑y =

S XY

⎛ ∑ y j nij ⎞ 1.531 ⎛ 241 ⎞ 2 ⎟ −⎜ ⎜ N ⎟ = 40 − ⎜ 40 ⎟ = 1,974 ⇒ SY = 1,974 = 1,405 N ⎝ ⎠ ⎝ ⎠ 1.537 241 241 Dependecia Lineal = − ⋅ = 2,124 ⇒ Directa 40 40 40
S XY 2,124 = = 0,714 2 2,974 SX

yi* = a + b xi ⇒ b =

a = y − b x = 6,025 − (0,714 ) ⋅ 6,025 ≈ 1,724
y * = 1,724 + 0,714 x i i

a) S

2 e

∑ (y =

j

− y * ) n ij
2

N

=

18,283 = 0,457 40 = 1.531 − (1,724) ⋅ 241 − (0,714) ⋅1.537 = 0,452 40

b) S

2 e

∑y n =

2 j ij

− a ∑ y j nij − b∑ xi y j nij
N

R2 = 1 −

Se2 0,452 =1− = 0,771 2 Sy 1,974
= 2,124 = 0,876 2,974 ⋅ 1,974

r=

S xy
2 S x2 ⋅ S y

________________________________________________________________________________________________________________________ Página 61

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

6º- RESOLUCION DE TABLAS BIDIMENSIONALES CON CAMBIO DE ESCALA O DE ORIGEN
OX
Xi Yj

10 1

20 3

30 2

40 5

50 2 1

Gj

vj

v jG j

v 2G j j

Bj

vj Bj

50 40 30 20 10
Hi ui ui H i ui2 H i Ai ui Ai

6 4 3 10 -2 - 20 40 -4 8 7 -1 -7 7 -1 1

5
2 1 8 0 0 0 2 0 7 1 7 7 3 3

5 8 2 16 32 -6 - 12

5 8 12 6 9 40 -4 86 0

2 1 0 -1 -2

10 8 0 -6 - 18 -6

20 8 0 6 36 70

2 2 - 10 -2 4

4 2 0 2 -8 0

Ai = ∑ v j nij B j = ∑ ui nij

1º) Medias
ui = xi − O X x − OX ⇒ u= ⇒ u c1 = x − O X ⇒ c1 c1 x = O X + u c1 = O X + y j − OY c2

∑u H
i

i

N

⎛−4⎞ ⋅ c1 = 30 + ⎜ ⎟ ⋅10 = 29 ⎝ 40 ⎠

vj =

⇒ v=

y − OY ⇒ v c2 = y − OY ⇒ c2

y = OY + v c2 = OY +

∑v G
j

j

N

⎛−6⎞ ⋅ c2 = 30 + ⎜ ⎟ ⋅10 = 28,5 ⎝ 40 ⎠

________________________________________________________________________________________________________________________ Página 62

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

2º) Varianzas y Desviaciones Típicas
⎡ u2H ⎛ u H ∑ i i −⎜ ∑ i i S =c ⎢ ⎜ N ⎢ N ⎝ ⎣
2 X 2 1

⎞ ⎟ ⎟ ⎠ ⎞ ⎟ ⎟ ⎠

2

2 ⎤ ⎡ ⎛−4⎞ ⎤ 2 86 ⎥ = 10 ⎢ − ⎜ ⎟ ⎥ = 214 ⇒ S X = 214 = 14,62 ⎥ ⎢ 40 ⎝ 40 ⎠ ⎥ ⎣ ⎦ ⎦

⎡ v 2G ⎛ v G ∑ j j −⎜ ∑ j j S =c ⎢ ⎜ N ⎢ N ⎝ ⎣
2 Y 2 2

2

2 ⎤ ⎡ 70 −6⎞ ⎤ ⎥ = 10 2 ⎢ − ⎛ ⎜ ⎟ ⎥ = 172,75 ⇒ SY = 172,75 = 13,14 ⎥ ⎢ 40 ⎝ 40 ⎠ ⎥ ⎣ ⎦ ⎦

3º) Covarianza
⎡ ∑ u i Ai ⎛ ∑ u i H i S XY = c1 ⋅ c 2 ⎢ −⎜ ⎜ N ⎢ N ⎝ ⎣ ⎞ ⎛ ∑ v jG j ⎟⋅⎜ ⎟ ⎜ N ⎠ ⎝ ⎞⎤ ⎟⎥ = 10 ⋅ 10 ⎡ 0 − ⎛ − 4 ⎞ ⋅ ⎛ − 6 ⎞⎤ = −1,5 ⇒ Dependencia Lineal Inversa ⎢ 40 ⎜ 40 ⎟ ⎜ 40 ⎟⎥ ⎟⎥ ⎝ ⎠ ⎝ ⎠⎦ ⎣ ⎠⎦

4º) Rectas de Regresión
Y X ⇒

(y − y)

= b ( x − x ) ⇒ y − 28,5 =

− 1,5 (x − 29) 214

⇒ yi = 28,703 − 0,007 xi X ⇒ ( x − x ) = b ' ( y − y ) ⇒ x − 29 = − 1,5 ( y − 28,5) ⇒ 172,75

Y

⇒ xi = 29,247 − 0,00868 yi

5º) Coeficiente de Determinación
R2 =

(S XY )2
2 2 S X ⋅ SY

=

(− 1,5)2
214 ⋅172,75

≅ 0,00006 ⇒ Incorrelación

________________________________________________________________________________________________________________________ Página 63

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

TEMA 10º - NUMEROS INDICES
1º- CONCEPTO Y APLICACIONES
Cuando queremos comparar entre si dos cantidades, lo más sencillo es dividir una entre la otra para calcular el valor de una de ellas y tomar la otra como 100. Por ejemplo, si queremos analizar el número de extranjeros que han visitado España durante 2.003, comparándolos con los que vinieron durante 2.002, diremos, por ejemplo, que son el 111 por 100. Esta forma de expresar los datos es más expresiva, ya que indica la evolución de la variable que estemos estudiando en el tiempo. Esto significa que, de manera general, un índice consiste en el cociente (multiplicado por 100) de la cantidad que estudiamos respecto de otra referencia. Podemos decir que el número índice es un número carente de unidades y cuya misión es reflejar con porcentaje, la variación de una o varias magnitudes relacionadas entre sí, tomando como referencia el valor de las mismas magnitudes en otro momento o en otro lugar. Las aplicaciones de los números índices son muy amplias, aunque es en el campo de la economía donde más se utiliza; así, se habla frecuentemente de números índices de producción, de precios, de valor, de cantidades, del coste de la vida, etc. Una vez explicado el concepto de número índice y sus aplicaciones, vamos a esquematizar a continuación las denominaciones de los distintos números índices:

Simples
o Sin Ponderar De la media aritmética simple De la media agregativa simple

Complejos
o Ponderados De Laspeyres De Paasche De Fisher

________________________________________________________________________________________________________________________ Página 64

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

2º- NUMEROS INDICES SIMPLES
Un número índice simple lo podemos definir como aquel que relaciona el valor de una única variable en un momento determinado con el valor de la variable en el tiempo de referencia. Los números índices simples se obtienen dividiendo cada uno de los valores de la variable y por un valor fijo correspondiente al momento que se toma como base y multiplicando por 100 dichos cocientes. Por ejemplo: calcula los números índices simples con base en 2.001 de los siguientes valores referentes al valor de las importaciones que ha efectuado nuestro país durante los últimos años (en miles de euros).

t
2.001 2.002 2.003 2.004 2.005 2.006

y
4.100 4.600 5.100 4.900 6.000 6.900

I (2.001 = 100 )
4.100 ⋅100 = 100% 4.100 4.600 ⋅100 = 112,19% 4.100 5.100 ⋅100 = 124,39% 4.100 4.900 ⋅100 = 119,51% 4.100 6.000 ⋅100 = 146,34% 4.100 6.900 ⋅100 = 168,29% 4.100

3º- NUMEROS INDICES COMPLEJOS SIN PONDERAR
Cuando queremos estudiar la evolución de un «conjunto de variables», utilizamos los números índices complejos, que resumen en una sola serie el conjunto de variables observadas en el tiempo. a) Método de la media aritmética simple. Indice de Sanerbeck Partimos de un conjunto de variables cuya evolución conjunta queremos estudiar. Lo primero que calculamos son los números índices simples correspondientes a los diferentes valores en cada período de tiempo (tomando un año como base), y a continuación calculamos la media aritmética simple de todos los índices de las diferentes variables de un mismo período de tiempo. Se obtiene así el «índice de Sanerbeck».

________________________________________________________________________________________________________________________ Página 65

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Todo lo expuesto queda sintetizado en la siguiente fórmula:

St =

∑y

yt
o

⋅ 100 =

∑I
n

t

n

Por ejemplo: calcula el índice de Sanerbeck de las siguientes variables, referentes a los beneficios obtenidos por unas empresas de alquiler de vehículos en los últimos años (en miles de euros). [Período base 2.001 = 100] Años 2.001 2.002 2.003 2.004 A 120 230 310 350 B 140 210 280 390 C 110 175 220 280 D 150 240 340 360 ∑ yi 520 855 1.150 1.380 S t (2.001=100) 100 % 165,1 % 221,2 % 266,1 %

Años 2.001 2.002 2.003 2.004

A 100 % 191,6 % 258,3 % 291,6 %

B 100 % 150 % 200 % 278,5 %

C 100 % 159 % 200 % 254,5 %

D 100 % 160 % 226,6 % 240 %

b) Método de la media agregativa simple. Indice de Bradstrest y Dutot Este método, que es muy sencillo, consiste en sumar o agregar todos los valores yi para cada tiempo ti y con el agregado resultante se calculan los índices simples. La fórmula para calcular el índice de Bradstrest y Dutot es:
Bt =

∑y ∑y

t

⋅ 100

o

Por ejemplo: calcula el índice de Bradstrest y Dutot del conjunto de valores del ejemplo anterior. Años 2.001 2.002 2.003 2.004 ∑ yi 520 855 1.150 1.380 B t (2.001=100) 100 % 164,4 % 221,2 % 265,4 %

________________________________________________________________________________________________________________________ Página 66

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

4º- NUMEROS INDICES COMPLEJOS DE PRECIOS Y CANTIDADES: LASPEYRES, PAASCHE Y FISHER Los números índices complejos sin ponderar, en contra de la ventaja de la sencillez de su cálculo y del escaso número de datos que necesitan para el mismo, tienen el inconveniente de que en muchos casos son poco representativos; en ocasiones nos interesa conocer la importancia intrínseca de cada una de las variables que componen nuestro estudio. El diferente peso o importancia que tiene cada una de nuestras variables viene expresado por unos coeficientes denominados «coeficientes de ponderación». En general se consideran como coeficientes de ponderación los precios o las cantidades, según cuáles sean las variables en estudio. Si la variable que estamos estudiando son los precios, el coeficiente de ponderación será las cantidades; sin embargo, si estamos estudiando las cantidades de diferentes productos, el coeficiente de ponderación será los precios de dichos productos. Los diferentes índices complejos ponderados que vamos a estudiar se distinguen por la diferente forma de ponderación. a) Indice de Laspeyres Para el cálculo de este índice, se considera siempre como coeficiente de ponderación para cada variable el del período base. • De esta forma tenemos el índice de Laspeyres para precios, cuya expresión es:
p Ln =

∑p ∑p

n o

⋅ qo ⋅ qo

• La expresión para el índice de Laspeyres para cantidades es:
Lq = n

∑q ∑q

n o

⋅ po ⋅ po

________________________________________________________________________________________________________________________ Página 67

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Por ejemplo: calcula el índice de Laspeyres de precios y de cantidades de los siguientes artículos (tomando como período base 2.001).
Años 2.001 2.002 2.003 2.004 Artículo A P Q 2 12 4 15 6 10 8 10 Artículo B P Q 5 9 7 10 7 5 8 5 Artículo C P Q 4 6 5 4 6 4 10 5

a.1) Indice de Laspeyres para precios:
n 2.001 2.002 2.003 2.004
p Ln =

∑p ∑p

n o

⋅ qo ⋅ qo

93 2 ×12 + 5 × 9 + 4 × 6 ⋅100 = ⋅100 = 100% 93 2 ×12 + 5 × 9 + 4 × 6 4 ×12 + 7 × 9 + 5 × 6 141 ⋅100 = ⋅100 = 151,61% 2 ×12 + 5 × 9 + 4 × 6 93 6 ×12 + 7 × 9 + 6 × 6 171 ⋅100 = ⋅100 = 183,87% 2 × 12 + 5 × 9 + 4 × 6 93 8 × 12 + 8 × 9 + 10 × 6 228 ⋅100 = ⋅100 = 245,16% 2 × 12 + 5 × 9 + 4 × 6 93

a.2) Indice de Laspeyres para cantidades:
n 2.001 2.002 2.003 2.004
Lq = n

∑q ∑q

n o

⋅ po ⋅ po

12 × 2 + 9 × 5 + 6 × 4 93 ⋅100 = ⋅100 = 100% 12 × 2 + 9 × 5 + 6 × 4 93 15 × 2 + 10 × 5 + 4 × 4 96 ⋅100 = ⋅100 = 103,22% 12 × 2 + 9 × 5 + 6 × 4 93 10 × 2 + 5 × 5 + 4 × 4 61 ⋅100 = ⋅100 = 65,59% 12 × 2 + 9 × 5 + 6 × 4 93 10 × 2 + 5 × 5 + 5 × 4 65 ⋅100 = ⋅100 = 69,89% 12 × 2 + 9 × 5 + 6 × 4 93

________________________________________________________________________________________________________________________ Página 68

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

b) Indice de Paasche Para el cálculo de este índice, se considera siempre como coeficiente de ponderación para cada variable el correspondiente al de cada período en estudio. • El índice de Paasche para precios, cuya expresión es: Pnp = ∑

• El índice de Paasche para cantidades es: Pnq = ∑

∑p

pn ⋅ qn
o

⋅ qn

∑q

qn ⋅ pn
o

⋅ pn

Por ejemplo: calcula el índice de Paasche de precios y de cantidades, del ejemplo anterior. b.1) Indice de Paasche para precios:
n 2.001 2.002 2.003 2.004
Pnp =

∑p ∑p

n o

⋅ qn ⋅ qn

8 × 10 + 8 × 5 + 10 × 5 170 ⋅100 = ⋅100 = 261,53% 2 × 10 + 5 × 5 + 4 × 5 65

6 × 10 + 7 × 5 + 6 × 4 119 ⋅ 100 = ⋅ 100 = 195,08% 2 × 10 + 5 × 5 + 4 × 4 61

2 ×12 + 5 × 9 + 4 × 6 93 ⋅100 = ⋅100 = 100% 2 ×12 + 5 × 9 + 4 × 6 93 4 ×15 + 7 × 10 + 5 × 4 150 ⋅100 = ⋅100 = 156,25% 2 ×15 + 5 × 10 + 4 × 4 96

b.2) Indice de Paasche para cantidades:
n 2.001 2.002 2.003 2.004
Pnq =

∑q ∑q

n o

⋅ pn ⋅ pn

12 × 2 + 9 × 5 + 6 × 4 93 ⋅100 = ⋅100 = 100% 12 × 2 + 9 × 5 + 6 × 4 93 15 × 4 + 10 × 7 + 4 × 5 150 ⋅100 = ⋅100 = 106,38% 12 × 4 + 9 × 7 + 6 × 5 141 10 × 6 + 5 × 7 + 4 × 6 119 ⋅100 = ⋅100 = 69,59% 12 × 6 + 9 × 7 + 6 × 6 171 10 × 8 + 5 × 8 + 5 ×10 170 ⋅100 = ⋅100 = 74,56% 12 × 8 + 9 × 8 + 6 ×10 228

________________________________________________________________________________________________________________________ Página 69

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

c) Indices de Fisher El índice de Fisher se define como la media geométrica de los números índices de Laspeyres y de Paasche. • El índice de Fisher para precios sería: Fnp = LP ⋅ Pnp n • La expresión del índice de Fisher para cantidades es: Fnq = Lq ⋅ Pnq n Por ejemplo: calcula el índice de Fisher de precios y de cantidades, del ejemplo anterior. c.1) Indice de Fisher para precios:
n 2.001 2.002 2.003 2.004
Fnp = LP ⋅ Pnp n

100 ⋅100 = 100%
151,61 ⋅156,25 = 153,91% 183,87 ⋅195,08 = 189,39% 245,16 ⋅ 261,53 = 253,21%

c.2) Indice de Fisher para cantidades:
n 2.001 2.002 2.003 2.004
Fnq = Lq ⋅ Pnq n

100 ⋅100 = 100%
103,22 ⋅106,38 = 104,78% 65,59 ⋅ 69,59 = 67,56% 69,89 ⋅ 74,56 = 72,18%

Por último, vamos a considerar las diferencias existentes entre los índices complejos ponderados que acabamos de ver. El índice de Laspeyres tiene la ventaja de que su cálculo es sencillo; sin embargo, presenta el inconveniente de que considera siempre como «peso» el del año base. Si nos encontramos con un caso «muy dinámico», la situación puede cambiar rápidamente. Al utilizar coeficientes de ponderación que poco nos dicen de la situación actual, la solución puede resultar falseada. El índice de Paasche no presenta el inconveniente del índice de Laspeyres, ya que los coeficientes de ponderación utilizados están siempre actualizados; sin embargo, su cálculo es más complicado y se necesita mayor información. El índice de Fisher es el más costoso de elaborar, pero también se le considera el más perfecto.

________________________________________________________________________________________________________________________ Página 70

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIOS RESUELTOS Y PREGUNTAS TIPO TEST

________________________________________________________________________________________________________________________ Página 71

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 01

Li-1 0 8 10 16 22

Li 8 10 16 22 30

xi 4 9 13 19 26

ni 3 4 9 7 2 25

di -1,500 -0,667 0,000 1,000 2,167

di ni -4,500 -2,667 0,000 7,000 4,333 4,167

di2ni 6,750 1,778 0,000 7,000 9,389 24,917

di3ni -10,125 -1,185 0,000 7,000 20,343 16,032

Ni 3 7 16 23 25

hi 0,38 2,00 1,50 1,17 0,25

di =

xi − O X x − 13 = i a 6

a) Media ⇨ x = O X +

∑d n
N

i i

⎛ 4,167 ⎞ ⋅ ai = 13 + ⎜ ⎟ ⋅ 6 = 14 ⎝ 25 ⎠

N − N i −1 (16 − 12,5) ⋅ 6 = 12,33 N 25 2 b) Mediana ⇨ = = 12,5 ⇒ Me = Li −1 + ai = 10 + 2 2 ni 9
c) Moda ⇨ Mo = Li −1 +

hi +1 1,5 ai = 8 + ⋅ 2 = 9,595 hi +1 + hi −1 1,5 + 0,38

d) Varianza y Desviación Típica ⇨

⎡ d 2n ⎛ d n ⎞2 ⎤ ∑ i i − ⎜ ∑ i i ⎟ ⎥ = 62 ⋅ ⎡ 24,917 − ⎛ 4,167 ⎞ 2 ⎤ = 34,88 ⇒ S = 34,88 = 5,9 S =a ⎢ ⎜ ⎟ ⎥ ⎢ X ⎜ N ⎟ ⎥ ⎝ 25 ⎠ ⎥ ⎢ N ⎢ 25 ⎝ ⎠ ⎦ ⎣ ⎦ ⎣
2 X 2

e) Asimetría de Fisher ⇨

⎡ d 3n ∑ i i − 3 ⋅ ∑ d i ni ⋅ ∑ d i2 ni + 2 ⋅ ⎛ ∑ d i ni ⎜ ⎢ ⎜ N N N ⎢ N ⎝ ⎣ 3 3 24,917 4,167 ⎛ 6 ⎞ ⎡16,032 ⎛ 4,167 ⎞ ⎤ − 3⋅ ⋅ + 2⋅⎜ =⎜ ⎟ ⎢ ⎟ ⎥= 25 25 ⎝ 25 ⎠ ⎥ ⎝ 5,9 ⎠ ⎢ 25 ⎣ ⎦ ⎛ a m3 = ⎜ ⎜S ⎝ X ⎞ ⎟ ⎟ ⎠
3

⎞ ⎟ ⎟ ⎠

3

⎤ ⎥= ⎥ ⎦

0,16 ⇒ Asimetría Positiva

________________________________________________________________________________________________________________________ Página 72

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 02

Li-1 50 55 60 65 70 75 80 85 90 95 100 105 110 115

Li 55 60 65 70 75 80 85 90 95 100 105 110 115 120

xi 52,5 57,5 62,5 67,5 72,5 77,5 82,5 87,5 92,5 97,5 102,5 107,5 112,5 117,5

ni 1 2 3 5 14 23 51 35 19 16 15 10 9 2 205

di -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7

di ni -6 -10 -12 -15 -28 -23 0 35 38 48 60 50 54 14 205

di2ni 36 50 48 45 56 23 0 35 76 144 240 250 324 98 1.425

di3ni -216 -250 -192 -135 -112 -23 0 35 152 432 960 1.250 1.944 686 4.531

di4ni 1.296 1.250 768 405 224 23 0 35 304 1.296 3.840 6.250 11.664 4.802 32.157

Ni 1 3 6 11 25 47

hi 0,20 0,40 0,60 1,00 2,80 4,60

96 10,20 128 142 169 184 194 203 205 7,00 3,80 3,20 3,00 2,00 1,80 0,40

________________________________________________________________________________________________________________________ Página 73

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

di =

xi − O X xi − 82,5 = a 5

a) Media ⇨ x = O X +

∑d n
i

i

N

⎛ 205 ⎞ ⋅ a i = 82,5 + ⎜ ⎟ ⋅ 5 = 87,5 ⎝ 205 ⎠

N − N i −1 (102,5 − 99) ⋅ 5 = 85,5 N 205 2 b) Mediana ⇨ = = 102,5 ⇒ Me = Li −1 + ai = 82,5 + 2 2 ni 35
c) Moda ⇨ Mo = Li −1 +

hi +1 35 ai = 80 + ⋅ 5 = 83,017 hi +1 + hi −1 35 + 23

d) Varianza y Desviación Típica ⇨

⎡ d 2n ⎛ d n ∑ i i −⎜∑ i i S =a ⎢ ⎜ N ⎢ N ⎝ ⎣
2 X 2

⎞ ⎟ ⎟ ⎠

2

⎤ ⎡1.425 ⎛ 205 ⎞ 2 ⎤ ⎥ = 52 ⋅ ⎢ −⎜ ⎟ ⎥ = 148,78 ⇒ S X = 148,78 = 12,19 ⎥ ⎢ 205 ⎝ 205 ⎠ ⎥ ⎣ ⎦ ⎦ SX 12,19 ⋅ 100 = ⋅ 100 = 13,93% x 87,5

e) Coeficiente de Variación ⇨ Cv = f) Asimetría de Pearson ⇨

As =

x − Mo 87,5 − 83,017 3 ( x − Me ) 3 (87,5 − 85,5) = = 0,36 ⇔ As = = = 0,49 SX SX 12,19 12,19

g) Asimetría de Fisher ⇨

⎛ 5 ⎞ m3 = ⎜ ⎟ ⎝ 12,19 ⎠

3

3 ⎡ 4.531 1.425 205 ⎛ 205 ⎞ ⎤ − 3⋅ ⋅ + 2⋅⎜ ⎟ ⎥ = 0,224 ⇒ Asimetría Positiva ⎢ 205 205 ⎝ 205 ⎠ ⎥ ⎢ 205 ⎣ ⎦

h) Asimetría de Pearson ⇨
4 2 4 4531 205 1.425 ⎛ 205 ⎞ ⎛ 5 ⎞ ⎡ 32.157 ⎛ 205 ⎞ ⎤ m4 = ⎜ − 4⋅ ⋅ + 6⋅ ⋅⎜ ⎟ ⎢ ⎟ ⎥ = 3,03 ⇒ Leptocútica ⎟ − 3⋅ ⎜ 205 205 205 ⎝ 205 ⎠ ⎝ 205 ⎠ ⎥ ⎝ 12,19 ⎠ ⎢ 205 ⎣ ⎦

________________________________________________________________________________________________________________________ Página 74

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 03
xi 137.900 147.900 219.900 229.900 261.000 282.000 296.000 469.000 1.780.000 2.730.000 ni 1 3 2 2 1 2 3 2 1 3 20 di -1.231 -1.131 -411 -311 0 210 350 2.080 15.190 24.690 di ni -1.231 -3.393 -822 -622 0 420 1.050 4.160 15.190 74.070 88.822 di2ni 1.515.361 3.837.483 337.842 193.442 0 88.200 367.500 8.652.800 230.736.100 1.828.788.300 2.074.517.028 Ni 1 4 6 8 9 11 14 16 17 20

di =

xi − O X xi − 261.000 = a 100

a) Media ⇨ x = O X +

∑d n
i

i

N

⎛ 88.822 ⎞ ⋅ a i = 216.000 + ⎜ ⎟ ⋅ 100 = 705.110 ⎝ 20 ⎠

b) Varianza y Desviación Típica ⇨
⎡ d 2n ⎛ d n ∑ i i −⎜∑ i i S =a ⎢ ⎜ N ⎢ N ⎝ ⎣
2 X 2

⎞ ⎟ ⎟ ⎠

2

⎤ ⎡ 2.074.517.028 ⎛ 88.822 ⎞ 2 ⎤ 2 ⎥ = 100 ⋅ ⎢ −⎜ ⎟ ⎥ = 848.024.822.000 20 ⎥ ⎝ 20 ⎠ ⎥ ⎢ ⎣ ⎦ ⎦

S X = 848.024.822.000 = 916.528,68

c) Coeficiente de Variación ⇨ Cv =

SX 916.528,68 ⋅ 100 = ⋅ 100 = 129,98% x 705.110

________________________________________________________________________________________________________________________ Página 75

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 04

Li-1 200 250 300 350 400 450 500 550

Li 250 300 350 400 450 500 550 600

xi 225 275 325 375 425 475 525 575

ni 21 12 7 3 5 8 14 17 87

di -3 -2 -1 0 1 2 3 4

di ni -63 -24 -7 0 5 16 42 68 37

di2ni 189 48 7 0 5 32 126 272 679

di3ni -567 -96 -7 0 5 64 378 1.088 865

di4ni 1.701 192 7 0 5 128 1.134 4.352 7.519

Ni 21 33 40 43 48 56 70 87

hi 0,42 0,24 0,14 0,06 0,10 0,16 0,28 0,34

di =

xi − O X x − 375 = i a 50

⎛ 37 ⎞ ⋅ ai = 375 + ⎜ ⎟ ⋅ 50 = 396,26 N ⎝ 87 ⎠ N − N i −1 (43,5 − 43) ⋅ 50 = 405 N 87 2 b) Mediana ⇨ ai = 400 + = = 43,5 ⇒ Me = Li −1 + ni 5 2 2
a) Media ⇨ x = O X +
i i

∑d n

c) Moda ⇨ x − Mo = 3 x − Me ⇒ Mo = 3 Me − 2 x = 3 ⋅ 405 − 2 ⋅ 396,26 = 422,48 d) Varianza y Desviación Típica ⇨

(

)

⎡ d 2n ⎛ d n ⎞2 ⎤ ⎡ 679 ⎛ 37 ⎞ 2 ⎤ ⎢ ∑ i i − ⎜ ∑ i i ⎟ ⎥ = 50 2 ⋅ ⎢ S =a − ⎜ ⎟ ⎥ = 19.059,32 ⇒ S X = 138,05 ⎜ N ⎟ ⎥ ⎢ N ⎢ 87 ⎝ 87 ⎠ ⎥ ⎝ ⎠ ⎦ ⎣ ⎦ ⎣ e) Asimetría de Fisher ⇨
2 X 2

⎛ a m3 = ⎜ ⎜S ⎝ X

3 ⎡ d 3n ∑ i i − 3 ⋅ ∑ d i ni ⋅ ∑ d i2 ni + 2 ⋅ ⎛ ∑ d i ni ⎞ ⎤ = ⎜ ⎟ ⎥ ⎢ ⎜ N ⎟ ⎥ N N ⎢ N ⎝ ⎠ ⎦ ⎣ 3 3 679 37 ⎛ 50 ⎞ ⎡ 865 ⎛ 37 ⎞ ⎤ − 3⋅ ⋅ + 2 ⋅ ⎜ ⎟ ⎥ = 0,006593 ⇒ Asimetría Positiva =⎜ ⎟ ⎢ 87 87 ⎝ 87 ⎠ ⎥ ⎝ 138,05 ⎠ ⎢ 87 ⎣ ⎦

⎞ ⎟ ⎟ ⎠

3

________________________________________________________________________________________________________________________ Página 76

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 05

Li-1 0 12 48 100 200 400 600

Li 12 48 100 200 400 600 1.000

xi 6 30 74 150 300 500 800

ni 827 4.941 6.567 11.067 10.238 2.706 2.194 38.540

di -1,44 -1,20 -0,76 0,00 1,50 3,50 6,50

di ni -1.190,88 -5.929,20 -4.990,92 0,00 15.357,00 9.471,00 14.261,00 26.978,00

di2ni 1.714,87 7.115,04 3.793,10 0,00 23.035,50 33.148,50 92.696,50 161.503,51

di3ni -2.469,41 -8.538,05 -2.882,76 0,00 34.553,25 116.019,75 602.527,25 739.210,04

Ni 827 5.768 12.335 23.402 33.640 36.346 38.540

hi 68,917 137,250 126,288 110,670 51,190 13,530 5,485

di =

xi − O X x − 150 = i 100 a

a) Media ⇨ x = O X + b) Mediana ⇨

∑d n
N

i i

⎛ 26.978 ⎞ ⋅ ai = 150 + ⎜ ⎟ ⋅ 100 = 220 ⎝ 38.540 ⎠

N 38.540 = = 19.270 2 2 N − N i −1 (19.270 − 12.335) ⋅ 100 = 162,66 2 Me = Li −1 + ai = 100 + ni 11.067 hi +1 162,28 ai = 12 + ⋅ 36 = 35,328 hi +1 + hi −1 162,28 + 68,91

c) Moda ⇨ Mo = Li −1 +

d) Varianza y Desviación Típica ⇨

⎡161.503,51 ⎛ 26.978 ⎞ 2 ⎤ 2 S X = 100 2 ⋅ ⎢ −⎜ ⎟ ⎥ = 37.005,42 ⇒ S X = 192,36 ⎝ 38.540 ⎠ ⎥ ⎢ 38.540 ⎣ ⎦
e) Asimetría de Fisher ⇨

⎛ 100 ⎞ m3 = ⎜ ⎟ ⎝ 192,36 ⎠

3

3 ⎡ 739.210,04 161.503,51 26.978 ⎛ 26.978 ⎞ ⎤ − 3⋅ ⋅ + 2⋅⎜ ⎟ ⎥ = 1,554 ⇒ Asimetría Positiva ⎢ 38.540 38.540 ⎝ 38.540 ⎠ ⎥ ⎢ 38.540 ⎣ ⎦

________________________________________________________________________________________________________________________ Página 77

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 06

Li-1 15 21 25 35 45 60

Li 21 25 35 45 60 70

xi 18 23 30 40 53 65

ni 36 40 39 36 30 26 207

di -1,20 -0,70 0,00 1,00 2,25 3,50

di ni -43,20 -28,00 0,00 36,00 67,50 91,00 123,30

di2ni 51,840 19,600 0,000 36,000 151,875 318,500 577,815

di3ni -62,208 -13,720 0,000 36,000 341,719 1.114,750 1.416,541

di4ni 74,650 9,604 0,000 36,000 768,867 3.901,625 4.790,746

Ni 36 76 115 151 181 207

hi 6,0 10,0 3,9 3,6 2,0 2,6

di =

xi − O X x − 30 = i 10 a

a) Media ⇨ x = O X +

∑d n
i

i

N

⎛ 123,3 ⎞ ⋅ ai = 30 + ⎜ ⎟ ⋅ 10 = 35,956 ⎝ 207 ⎠

N − N i −1 (103,5 − 76) ⋅ 10 = 32,051 N 207 b) Mediana ⇨ ai = 25 + = = 103,5 ⇒ Me = Li −1 + 2 ni 39 2 2
c) Moda ⇨ Mo = Li −1 +

hi +1 3,9 ai = 21 + ⋅ 4 = 22,575 hi +1 + hi −1 3,9 + 6

d) Varianza y Desviación Típica ⇨

⎡ 577,815 ⎛ 123,3 ⎞ 2 ⎤ 2 S X = 10 2 ⋅ ⎢ −⎜ ⎟ ⎥ = 243,657 ⇒ S X = 15,609 ⎝ 207 ⎠ ⎥ ⎢ 207 ⎣ ⎦
e) Asimetría de Fisher ⇨

⎛ 10 ⎞ m3 = ⎜ ⎟ ⎝ 15,609 ⎠

3

3 ⎡1.416,541 577,815 123,3 ⎛ 123,3 ⎞ ⎤ − 3⋅ ⋅ + 2⋅⎜ ⎟ ⎥ = 0,5989 ⇒ Asimetría Positiva ⎢ 207 207 ⎝ 207 ⎠ ⎥ ⎢ 207 ⎣ ⎦

________________________________________________________________________________________________________________________ Página 78

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 07
Li-1 15 19 22 26 36 46 61 Li 18 21 25 35 45 60 70 xi 16,5 20,0 23,5 30,5 40,5 53,0 65,5 ni 10 9 19 27 42 42 27 176 xi·ni 165,00 180,00 446,50 823,50 1.701,00 2.226,00 1.768,50 7.310,50 xi2·ni 2.722,50 3.600,00 10.492,75 25.116,75 68.890,50 117.978,00 115.836,75 344.637,25 xi3·ni 44.921,250 72.000,000 246.579,625 766.060,875 2.790.065,250 6.252.834,000 7.587.307,125 17.759.768,125 Ni 10 19 38 65 107 149 176 hi 3,3 4,5 6,3 3,0 4,6 3,0 3,0

a) Media ⇨ x =

∑ xi ni 7.310,5 = = 41,53 N 176

N − N i −1 (88 − 65) ⋅ 9 = 40,92 N 176 b) Mediana ⇨ = = 88 ⇒ Me = Li −1 + 2 ai = 36 + 2 2 ni 42
c) Moda ⇨ Mo = Li −1 +

hi +1 3 ai = 22 + ⋅ 3 = 23,2 hi +1 + hi −1 3 + 4,5

d) Varianza y Desviación Típica ⇨

⎡ 344.637,25 ⎛ 7.310,5 ⎞ 2 ⎤ S =⎢ −⎜ ⎟ ⎥ = 232,849 ⇒ S X = 15,259 176 ⎝ 176 ⎠ ⎥ ⎢ ⎣ ⎦
2 X

e) Asimetría de Fisher ⇨

⎛ 1 ⎞ m3 = ⎜ ⎟ ⎝ 15,529 ⎠

3

3 ⎡17.759.768,125 344.637,25 7.310,5 ⎛ 7.310,5 ⎞ ⎤ − 3⋅ ⋅ + 2⋅⎜ ⎟ ⎥ = 0,0608 ⇒ As. Positiva ⎢ 176 176 176 ⎝ 176 ⎠ ⎥ ⎢ ⎣ ⎦

________________________________________________________________________________________________________________________ Página 79

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 08

Li-1 50 60 70 80 90 100 110

Li 60 70 80 90 100 110 120

xi 55 65 75 85 95 105 115

ni 8 10 16 14 10 5 2 65

di -3 -2 -1 0 1 2 3

di ni -24 -20 -16 0 10 10 6 -34

di2ni 72 40 16 0 10 20 18 176

di3ni -216 -80 -16 0 10 40 54 -208

di4ni 648 160 16 0 10 80 162 1.076

Ni 8 18 34 48 58 63 65

hi 0,80 1,00 1,60 1,40 1,00 0,50 0,20

xi − O X x − 85 ⎛ − 34 ⎞ = i ⇒ a) Media ⇨ x = 85 + ⎜ ⎟ ⋅ 10 = 79,76 a 10 ⎝ 65 ⎠ N − N i −1 (32,5 − 18) ⋅ 10 = 79,06 N 65 b) Mediana ⇨ = = 32,5 ⇒ Me = Li −1 + 2 ai = 70 + 2 2 ni 16 di =
c) Moda ⇨ Mo = Li −1 +

hi +1 14 ai = 70 + ⋅ 10 = 75,83 hi +1 + hi −1 14 + 10

d) Varianza y Desviación Típica ⇨

⎡176 ⎛ − 34 ⎞ 2 ⎤ S = 10 ⋅ ⎢ −⎜ ⎟ ⎥ = 243,408 ⇒ S X = 15,6 ⎢ 65 ⎝ 65 ⎠ ⎥ ⎣ ⎦
2 X 2

e) Asimetría de Fisher ⇨

⎛ 10 ⎞ m3 = ⎜ ⎟ ⎝ 15,6 ⎠

3

3 ⎡ − 208 ⎛ − 34 ⎞ ⎤ ⎛ − 34 ⎞ ⎛ 176 ⎞ − 3⋅ ⎜ ⎟ ⎥ = 0,2 ⇒ Asimetría Positiva ⎟ + 2⋅⎜ ⎟⋅⎜ ⎢ ⎝ 65 ⎠ ⎥ ⎝ 65 ⎠ ⎝ 65 ⎠ ⎢ 65 ⎣ ⎦

h) Asimetría de Pearson ⇨

⎛ 10 ⎞ m4 = ⎜ ⎟ ⎝ 15,6 ⎠

4

2 4 ⎡1.076 ⎛ − 34 ⎞ ⎤ ⎛ 176 ⎞ ⎛ − 34 ⎞ ⎛ − 208 ⎞ ⎛ − 34 ⎞ − 3⋅ ⎜ ⋅⎜ + 6⋅⎜ ⋅⎜ − 4⋅⎜ ⎟ ⎥ = 2,37 ⇒ Platocútica ⎟ ⎟ ⎟ ⎟ ⎢ ⎝ 65 ⎠ ⎥ ⎝ 65 ⎠ ⎝ 65 ⎠ ⎝ 65 ⎠ ⎝ 65 ⎠ ⎢ 65 ⎣ ⎦

________________________________________________________________________________________________________________________ Página 80

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 09

Li-1 100 110 120 130 140 150 160 170 180 190

Li 110 120 130 140 150 160 170 180 190 200

xi 105 115 125 135 145 155 165 175 185 195

ni 4 7 18 32 26 21 16 10 4 2 140

di -4 -3 -2 -1 0 1 2 3 4 5

di ni -16 -21 -36 -32 0 21 32 30 16 10 4

di2ni 64 63 72 32 0 21 64 90 64 50 520

di3ni -256 -189 -144 -32 0 21 128 270 256 250 304

di4ni 1.024 567 288 32 0 21 256 810 1.024 1.250 5.272

Ni 4 11 29 61 87 108 124 134 138 140

hi 0,40 0,70 1,80 3,20 2,60 2,10 1,60 1,00 0,40 0,20

di =

xi − O X x − 145 = i ⇒ 10 a

⎛ 4 ⎞ a) Media ⇨ x = 145 + ⎜ ⎟ ⋅ 10 = 145,28 ⎝ 140 ⎠

b) Varianza y Desviación Típica ⇨

⎡ 520 ⎛ 4 ⎞ 2 ⎤ S = 10 ⋅ ⎢ −⎜ ⎟ ⎥ = 371,346 ⇒ S X = 19,27 ⎢ 140 ⎝ 140 ⎠ ⎥ ⎣ ⎦
2 X 2

c) Asimetría de Fisher ⇨

⎛ 10 ⎞ m3 = ⎜ ⎟ ⎝ 19,27 ⎠

3

3 ⎡ 304 ⎛ 4 ⎞ ⎤ ⎛ 520 ⎞ ⎛ 4 ⎞ − 3⋅ ⎜ ⎟ ⎥ = 0,258 ⇒ Asimetría Positiva ⎟ + 2⋅⎜ ⎟⋅⎜ ⎢ ⎝ 140 ⎠ ⎥ ⎝ 140 ⎠ ⎝ 140 ⎠ ⎢ 140 ⎣ ⎦

d) Asimetría de Pearson ⇨

⎛ 10 ⎞ m4 = ⎜ ⎟ ⎝ 19,27 ⎠

4

2 4 ⎡ 5.272 ⎛ 4 ⎞ ⎤ ⎛ 520 ⎞ ⎛ 4 ⎞ ⎛ 304 ⎞ ⎛ 4 ⎞ − 3⋅ ⎜ ⋅⎜ + 6⋅⎜ ⋅⎜ − 4⋅⎜ ⎟ ⎥ = 2,71 ⇒ Platocútica ⎟ ⎟ ⎟ ⎟ ⎢ ⎝ 140 ⎠ ⎥ ⎝ 140 ⎠ ⎝ 140 ⎠ ⎝ 140 ⎠ ⎝ 140 ⎠ ⎢ 140 ⎣ ⎦

________________________________________________________________________________________________________________________ Página 81

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 10
Cierto profesor de estadística de una Escuela de Turismo a la hora de la puntuación final, calificaba a los alumnos siguiendo el siguiente criterio: Suspensos: 40%; Aprobados: 30%; Notables: 15%; Sobresalientes: 10%; Matriculas: 5% Si las notas obtenidas pos sus alumnos vienen dadas en la siguiente tabla, se pide calcular la nota máxima para conseguir: Suspenso, Aprobado, Notable, Sobresaliente y Matricula. Notas 0-1 1–2 2–3 3–4 4–5 5–6 6–7 7–8 8–9 9 – 10 Nº de alumnos → ni 36 74 56 81 94 70 41 28 16 4 500 Ni 36 110 166 247 341 411 452 480 496 500

SOLUCIÓN: Debemos calcular los percentiles o centiles: 40º, 70º, 85º, 95º.

pN − N i −1 (200 − 166) ⋅ 1 = 3,419 pN 40 ⋅ 500 100 1º) = = 200 ⇒ P40 º = Li −1 + ai = 3 + 100 100 ni 81 pN − N i −1 (350 − 341) ⋅ 1 = 5,128 pN 70 ⋅ 500 100 2º) = = 350 ⇒ P70 º = Li −1 + ai = 5 + 100 100 ni 70 pN − N i −1 (425 − 411) ⋅ 1 = 6,341 pN 85 ⋅ 500 100 3º) = = 425 ⇒ P85º = Li −1 + ai = 6 + 100 100 ni 41 pN − N i −1 (475 − 452 ) ⋅ 1 = 7,821 pN 95 ⋅ 500 100 4º) = = 475 ⇒ P95º = Li −1 + ai = 7 + 100 100 ni 28
De estos datos se puede deducir: • Suspensos: Nota igual o inferior a 3,419. • Aprobados: Desde 3,42 a 5,128 inclusive. • Notables: Desde 5,13 a 6,341 inclusive. • Sobresalientes: Desde 6,35 a 7,821 inclusive. • Matrículas: Desde 7,83 a 10 inclusive.

________________________________________________________________________________________________________________________ Página 82

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 11

Li-1 0 4 10 16 20 24 32 36 42

Li 4 10 16 20 24 32 36 42 60

xi 2 7 13 18 22 28 34 39 51

ni 2 5 8 15 30 16 7 6 1 90

di -5,000 -3,750 -2,250 -1,000 0,000 1,500 3,000 4,250 7,250

di ni -10,00 -18,75 -18,00 -15,00 0,00 24,00 21,00 25,50 7,25 16,00

di2 ni 50,000 70,313 40,500 15,000 0,000 36,000 63,000 108,375 52,563 435,750

di 3 ni -250,000 -263,672 -91,125 -15,000 0,000 54,000 189,000 460,594 381,078 464,875

di4 ni 1.250,000 988,770 205,031 15,000 0,000 81,000 567,000 1.957,523 2.762,816 7.827,141

Ni 2 7 15 30 60 76 83 89 90

hi 0,50 0,83 1,33 3,75 7,50 2,00 1,75 1,00 0,06

di =

dn ⎛ 16 ⎞ a) Media ⇨ x = OX + ∑ i i ⋅ ai = 22 + ⎜ ⎟ ⋅ 4 = 22,71 N ⎝ 90 ⎠ N − N i −1 (45 − 30) ⋅ 4 = 22 N 90 = = 45 ⇒ Me = Li −1 + 2 ai = 20 + b) Mediana ⇨ 2 2 ni 30
c) Moda ⇨ Mo = Li −1 +

xi − OX xi − 22 = 4 a

hi +1 2 ai = 20 ⋅ ⋅ 4 = 21,39 hi +1 + hi −1 2 + 3,75

d) Varianza y Desviación Típica ⇨

⎡ d 2n ⎛ d n ⎞2 ⎤ ∑ i i − ⎜ ∑ i i ⎟ ⎥ = 42 ⎡ 435,75 − ⎛ 16 ⎞2 ⎤ = 76,96 ⇒ S X = 76,96 = 8,77 S =a ⎢ ⎜ ⎟ ⎥ ⎢ ⎜ N ⎟ ⎥ ⎢ N ⎝ 90 ⎠ ⎥ ⎢ 90 ⎝ ⎠ ⎦ ⎣ ⎦ ⎣
2 X 2

e) Coeficiente de Variación ⇨ Cv =

SX 8,77 ⋅ 100 = ⋅ 100 = 38,61% x 22 ,71

________________________________________________________________________________________________________________________ Página 83

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

f) Asimetría de Pearson ⇨

As =

x − Mo 22,71 − 21,39 = = 0,15 SX 8,77 3 ( x − Me ) 3 (22,71 − 22 ) = = 0,24 SX 8,77

As =

g) Asimetría de Fisher ⇨
3 ⎡ d 3n ∑ i i − 3 ⋅ ∑ d i ni ⋅ ∑ d i2 ni + 2 ⋅ ⎛ ∑ d i ni ⎞ ⎤ = ⎜ ⎟ ⎥ ⎢ ⎜ N ⎟ ⎥ N N ⎢ N ⎝ ⎠ ⎦ ⎣ 3 3 16 437 ,75 ⎛ 4 ⎞ ⎡ 464,875 ⎛ 16 ⎞ ⎤ − 3⋅ ⋅ + 2 ⋅ ⎜ ⎟ ⎥ = 0,246 ⇒ Asimetría Positiva =⎜ ⎟ ⎢ 90 90 ⎝ 90 ⎠ ⎥ ⎝ 8,77 ⎠ ⎢ 90 ⎣ ⎦

⎛ a m3 = ⎜ ⎜S ⎝ X

⎞ ⎟ ⎟ ⎠

3

h) Asimetría de Pearson ⇨

⎛ a m4 = ⎜ ⎜S ⎝ X

⎞ ⎟ ⎟ ⎠

4

⎡ d 4n d 3n dn d 2n ⎛ d n ⎢∑ i i − 4⋅ ∑ i i ⋅ ∑ i i + 6⋅ ∑ i i ⎜ ∑ i i N N N ⎜ N ⎢ N ⎝ ⎣

⎞ ⎛ dn ⎟ − 3⋅⎜ ∑ i i ⎟ ⎜ N ⎠ ⎝
2

⎞ ⎟ ⎟ ⎠

4

⎤ ⎥= ⎥ ⎦

⎛ 4 ⎞ =⎜ ⎟ ⎝ 8,77 ⎠

4

2 4 ⎡ 7.827 ,141 464,75 16 435,75 ⎛ 16 ⎞ ⎛ 16 ⎞ ⎤ − 3 ⋅ ⎜ ⎟ ⎥ = 3,6 ⇒ Leptocútica − 4⋅ ⋅ + 6⋅ ⎜ ⎟ ⎢ 90 90 90 ⎝ 90 ⎠ ⎝ 90 ⎠ ⎥ ⎢ 90 ⎣ ⎦

________________________________________________________________________________________________________________________ Página 84

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

i) Índice de Gini ⇨

Li-1 0 4 10 16 20 24 32 36 42

Li 4 10 16 20 24 32 36 42 60

xi 2 7 13 18 22 28 34 39 51

ni 2 5 8 15 30 16 7 6 1 90

xi ni 4 35 104 270 660 448 238 234 51 2.044

%ni 2,222 5,556 8,889 16,66 7 33,33 3 17,77 8 7,778 6,667 1,111

%xi ni 0,196 1,712 5,088 13,209 32,290 21,918 11,644 11,448

pi 2,222 7,778 16,667 33,333 66,667 84,444 92,222 98,889 402,222

qi 0,196 1,908 6,996

pi - qi 2,027 5,870 9,671

20,205 13,128 52,495 14,172 74,413 10,032 86,057 97,505 6,165 1,384 0,000 62,447

2,495 100,000 100,000

Ig =

∑(p
i =1 i =1

k −1

i

− qi )
i

∑p

k −1

=

62,447 = 0,155 ⇒ Concentración no muy fuerte 402,222

El área valdrá : AT =

Ig 0,155 = = 0,0775 2 2

________________________________________________________________________________________________________________________ Página 85

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 16 – 2 Variables
Hallar los datos que faltan en la siguiente distribución bidimensional, calcular la Varianza Residual y el Coeficiente de Determinación, sabiendo que: x = 3,125 , y = 2,0625 y la S XY = 1,1796875
xi
1 2 3 x4 5

yj
1 1 2 y4 y5

nij
2 3 5 3 n5 16

xi nij
2 6 15 3x4 15 38+3x4

xi2 nij

y j nij
2 3 10 3y4 3y5 15+3y4+3y4

xi y j nij

y 2 nij j

2 12 45 48 75 182

2 6 30 12y4 15y5 38+12y4+15y4

2 3 20 12 48 85

1º Paso ⇒ 13 + n5 = 16 ⇒ n5 = 3

2º Paso ⇒ x =

∑ xi
N

nij

⇒ 3,125 =

38 + 3x4 ⇒ 50 = 38 + 3x4 ⇒ x4 = 4 16

3º Paso ⇒ Plantear el sistema de ecuaciones

y=

∑ yj
N

nij

⇒ 2 ,0625 =

15 + 3 y4 + 3 y5 ⇒ 33 = 15 + 3 y4 + 3 y5 ⇒ y4 + y5 = 6 16

S XY =

∑ xi y j nij − x ⋅ y ⇒ 1,1796875 = 38 + 12 y4 + 15 y5 − 3,125 ⋅ 2 ,0625
N 16
38 + 12 y4 + 15 y5 38 + 12 y4 + 15 y5 − [6,4453125] ⇒ 7 ,625 = 16 16

1,1796875 =

122 = 38 + 12 y4 + 15 y5 ⇒ 12 y4 + 15 y5 = 84 ⇒ 4 y4 + 5 y5 = 28
y 4 + y5 = 6 4 y4 + 5 y5 = 28

y4 = 2 y5 = 4

________________________________________________________________________________________________________________________ Página 86

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

Sustituyendo los valores hallados en la tabla obtenemos :

∑ ∑

y j nij = 33 xi y j nij = 122

4º Paso ⇒ Calcular las Varianzas
2 SX =

182 2 − (3,125) = 1,609375 16 85 2 2 SY = − (2 ,0625) = 1,05859 16

5º Paso ⇒ Calcular la Re cta de Re gresión

Y

X

(y − y)

= b (x − x ) 1,179 (x − 3,125) ⇒ 1,609 yi = −0,2265 + 0,7327 xi

y − 2 ,0625 =

6º Paso ⇒ Calcular la Varianza Re sidual

2 Se

∑ y 2j nij − a ∑ y j nij − b∑ xi y j nij =
N

=

85 − (− 0,2265) ⋅ 33 − (0,7327 ) ⋅ 122 = 0,1928 16

7º Paso ⇒ Calcular el Coeficiente de Determinación
2 Se 0,1928 R = 1− 2 = 1− = 0,8177 ⇒ 81,77% de fiabilidad 1,058 Sy 2

________________________________________________________________________________________________________________________ Página 87

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 23 – 2 Variables
OX
Xi Yj

75 3 4 11 1 19 -1 - 19 19 -9 9

105 2 6

135 --6 3 --9 1 9 9 -6 6

Gj

vj

v jG j

v 2G j j

Bj

vj Bj

15 25 35 45
Hi ui ui H i ui2 H i Ai ui Ai

4
--12 0 0 0 - 10 0

5 16 18 1 40 - 10 28 3

-2 -1 0 1

- 10 - 16 0 1 - 25

20 16 0 1 37

-3 2 -8 -1

6 -2 0 -1 3

1º) Medias

ui =

xi − O X xi − 105 ∑ ui H i ⋅ c = 105 + ⎛ − 10 ⎞ ⋅ 30 = 97 ,5 = ⇒ x = OX + ⎜ ⎟ 1 30 c1 N ⎝ 40 ⎠

vj =

y j − OY c2

=

y j − 35 10

⇒ y = OY +

∑ v jG j ⋅ c
N

2

⎛ − 25 ⎞ = 35 + ⎜ ⎟ ⋅ 10 = 28,75 ⎝ 40 ⎠

2º) Varianzas y Desviaciones Típicas

2 SX

=

2 c1 ⎢

⎡ ∑ ui2 H i ⎢ ⎣ N

2 2 ⎤ ⎡ ⎛ ∑ ui H i ⎞ ⎤ 2 28 ⎛ − 10 ⎞ −⎜ ⎟ ⎥ = 30 ⎢ − ⎜ ⎟ ⎥ = 573,75 40 ⎝ 40 ⎠ ⎥ ⎝ N ⎠ ⎥ ⎢ ⎦ ⎣ ⎦

2 SY

=

2 c2 ⎢

⎡ ∑ v 2G j j ⎢ ⎣ N

⎛ ∑ v jG j ⎞ −⎜ ⎜ N ⎟ ⎟ ⎝ ⎠

2

2 ⎤ ⎡ ⎤ 2 37 ⎛ − 25 ⎞ ⎥ = 10 ⎢ − ⎜ ⎟ ⎥ = 53,4375 ⎥ ⎢ 40 ⎝ 40 ⎠ ⎥ ⎣ ⎦ ⎦

________________________________________________________________________________________________________________________ Página 88

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

3º) Covarianza

⎡ ∑u A ⎛ ∑u H ⎞ ⎛ ∑v jGj ⎞⎤ ⎡ 3 ⎛ − 10⎞ ⎛ − 25⎞⎤ SXY = c1 ⋅ c2 ⎢ i i − ⎜ i i ⎟ ⋅ ⎜ ⎟ ⎜ N ⎟⎥ = 30⋅10 ⎢40 − ⎜ 40 ⎟ ⋅ ⎜ 40 ⎟⎥ = − 24,375 ⎝ ⎠ ⎝ ⎠⎦ ⎝ N ⎠ ⎝ ⎣ ⎠⎦ ⎣ N
4º) Rectas de Regresión

Y

X

(y − y)

= b (x − x ) − 24 ,375 (x − 97 ,5) ⇒ 573,75 yi = 32 ,884 − 0,0424 xi

y − 28,75 =

X

Y

⇒ ( x − x ) = b' ( y − y )

x − 97 ,5 =

− 24 ,375 ( y − 28,75) ⇒ 53,4375

xi = 110,61 − 0,456 yi

5º) Coeficiente de Determinación y Coeficiente de Correlación Lineal

R

2

(S XY )2 =
S xy
2 2 Sx ⋅ S y

2 2 S X ⋅ SY

=

(− 24 ,375)2
573,75 ⋅ 53,4375

≅ 0,0206 ⇒ Incorrelación

r=

=

− 24 ,374 = − 0,1392 573,75 ⋅ 53,4375

________________________________________________________________________________________________________________________ Página 89

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 24 – 2 Variables
OX
Xi Yj

1,6 3 6 4 1 14 -1 - 14 14 3 -3

1,7 2

1,8 --4 5 8 17 1 17 17 21 21

Gj

vj

v jG j

v 2G j j

Bj

vj Bj

60 70 80 90
Hi ui ui H i ui2 H i Ai ui Ai

10
11 6 29 0 0 0 21 0

5 20 20 15 60 3 31 8

-1 0 1 2

-5 0 20 30 45

5 0 20 60 85

-3 -2 1 7

3 0 1 14 18

1º) Medias

ui = vj =

xi − O X xi − 1,7 ∑ ui H i ⋅ c = 1,7 + ⎛ 3 ⎞ ⋅ 0,10 = 1,705 ⇒ x = OX + = ⎜ ⎟ 1 c1 0,10 N ⎝ 60 ⎠ y j − OY c2 = y j − 70 10
⇒ y = OY +

∑ v jG j ⋅ c
N

2

⎛ 45 ⎞ = 70 + ⎜ ⎟ ⋅ 10 = 77 ,5 ⎝ 60 ⎠

2º) Varianzas y Desviaciones Típicas

2 SX

=

2 c1 ⎢

⎡ ∑ ui2 H i ⎢ ⎣ N

2 2 ⎤ ⎡ ⎛ ∑ ui H i ⎞ ⎤ 2 31 ⎛ 3 ⎞ −⎜ ⎟ ⎥ = 0,10 ⎢ − ⎜ ⎟ ⎥ = 0,00514 ⎝ N ⎠ ⎥ ⎢ 60 ⎝ 60 ⎠ ⎥ ⎦ ⎣ ⎦

2 SY

=

2 c2 ⎢

⎡ ∑ v 2G j j ⎢ ⎣ N

⎛ ∑ v jG j ⎞ −⎜ ⎜ N ⎟ ⎟ ⎝ ⎠

2

2 ⎤ ⎡ ⎤ 2 85 ⎛ 45 ⎞ ⎥ = 10 ⎢ − ⎜ ⎟ ⎥ = 85,4167 ⎥ ⎢ 60 ⎝ 60 ⎠ ⎥ ⎣ ⎦ ⎦

________________________________________________________________________________________________________________________ Página 90

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

3º) Covarianza
⎡ ∑u A ⎛ ∑u H ⎞ ⎛ ∑v j G j ⎞⎤ 3 45 ⎤ ⎡18 ⎟⎥ = 0,10⋅10 ⎢ − ⎛ ⎞ ⋅ ⎛ ⎞⎥ = 0,2625 S XY = c1 ⋅ c2 ⎢ i i − ⎜ i i ⎟ ⋅ ⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎣60 ⎝ 60⎠ ⎝ 60⎠⎦ ⎝ N ⎠ ⎝ N ⎠⎦ ⎣ N

4º) Rectas de Regresión

Y

X

(y − y)
y − 77 ,5 =

= b (x − x ) 0,2625 (x − 1,705) ⇒ 0,00514 yi = −9 ,57 − 51,07 xi

X

Y

⇒ ( x − x ) = b' ( y − y ) x − 1,705 = 0,2625 ( y − 77 ,5) ⇒ 85,4167

xi = 1,4724 + 0,003 yi

5º) Coeficiente de Determinación y Coeficiente de Correlación Lineal

R

2

(S XY )2 =
S xy
2 2 Sx ⋅ S y

2 2 S X ⋅ SY

=

(0,2625)2
0,00514 ⋅ 85,4167

≅ 0,1564 ⇒ Incorrelación

r=

=

0,2625 = 0,3961 0,00514 ⋅ 85,4167

________________________________________________________________________________________________________________________ Página 91

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 30 – 2 Variables
OX
Xi Yj

2,5 15 10 5 --30 -1 - 30 30 - 10 10

7,5 20

15 6 6 2 7 21 1,5 31,5

30 1 9 4 --14 4,5 63

Gj

vj

v jG j

v 2G j j

Bj

vj Bj

2,5 7,5 12,5 22,5
Hi ui ui H i ui2 H i Ai ui Ai

10
3 2 35 0 0

42 35 14 9 100 64,5

-1 0 1 3

- 42 0 14 27 -1

42 - 1,5 0 39,5 14 16 81 10,5 137

1,5 0 16 31,5 49

0 47,25 283,5 360,75 17 - 11 3 0 25,5 13,5 49

1º) Medias

ui = vj =

xi − O X xi − 7 ,5 ∑ ui H i ⋅ c = 7 ,5 + ⎛ 64,5 ⎞ ⋅ 5 = 10,725 ⇒ x = OX + = ⎟ ⎜ 1 5 c1 N ⎝ 100 ⎠ y j − OY c2 = y j − 7 ,5 5
⇒ y = OY +

∑ v jG j ⋅ c
N

2

⎛ −1 ⎞ = 7 ,5 + ⎜ ⎟ ⋅ 5 = 7 ,45 ⎝ 100 ⎠

2º) Varianzas y Desviaciones Típicas

2 SX

=

2 c1 ⎢

⎡ ∑ ui2 H i ⎢ ⎣ N

2 2 ⎛ ∑ ui H i ⎞ ⎤ 2 ⎡ 360,75 ⎛ 64 ,5 ⎞ ⎤ −⎜ −⎜ ⎟ ⎥=5 ⎢ ⎟ ⎥ = 79 ,7868 100 ⎝ 100 ⎠ ⎥ ⎝ N ⎠ ⎥ ⎢ ⎦ ⎣ ⎦

2 SY

=

2 c2 ⎢

⎡ ∑ v 2G j j ⎢ ⎣ N

⎛ ∑ v jG j ⎞ −⎜ ⎜ N ⎟ ⎟ ⎝ ⎠

2

2 ⎤ ⎡ ⎤ 2 137 ⎛ − 1 ⎞ −⎜ ⎥=5 ⎢ ⎟ ⎥ = 34 ,2475 100 ⎝ 100 ⎠ ⎥ ⎥ ⎢ ⎣ ⎦ ⎦

________________________________________________________________________________________________________________________ Página 92

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

3º) Covarianza

⎡ u A ⎛ u H ⎞ ⎛ ∑v jGj ⎞⎤ ⎡ 49 ⎛ 64,5⎞ ⎛ −1 ⎞⎤ SXY = c1 ⋅ c2 ⎢ ∑ i i − ⎜ ∑ i i ⎟ ⋅ ⎜ ⎜ N ⎟⎥ = 5⋅ 5 ⎢100− ⎜ 100⎟ ⋅ ⎜100⎟⎥ = 12,411 ⎟ ⎠ ⎝ ⎠⎦ ⎝ ⎝ N ⎠ ⎝ ⎣ ⎠⎦ ⎣ N
4º) Rectas de Regresión

Y

X

(y − y)
y − 7 ,45 =

= b (x − x ) 12 ,411 (x − 10,725) ⇒ 79 ,7868 yi = 5,79 + 0,155 xi

X

Y

⇒ ( x − x ) = b' ( y − y ) x − 10,725 = 12 ,411 ( y − 7 ,45) ⇒ 34 ,24

xi = 8,025 + 0,36 yi

5º) Coeficiente de Determinación y Coeficiente de Correlación Lineal

R

2

(S XY )2 =
S xy
2 2 Sx ⋅ S y

2 2 S X ⋅ SY

=

(12,411)2
79 ,7868 ⋅ 34 ,24

≅ 0,05638 ⇒ Incorrelación

r=

=

12 ,411 = 0,2374 79 ,7868 ⋅ 34 ,24

________________________________________________________________________________________________________________________ Página 93

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

EJERCICIO Nº 31 – 2 Variables
OX
Xi Yj

7,5 2 --1 --1 4 -2 -8 16 2 -4

12,5 4 3 --1 --8 -1 -8 8 10 - 10

17,5 1 5

22,5 27,5 --2 --1 --3 1 3 3 1 1 ----2 2 --4 2 8 16 -2 -4

Gj

vj

v jG j

v 2G j j

Bj

vj Bj

1.990 1.985 1.980 1.975 1.970
Hi ui ui H i ui2 H i Ai ui Ai

3
--2 11 0 0 0 3 0

7 10 6 4 3 30 -5 43 - 17

2 1 0 -1 -2

14 10 0 -4 -6 14

28 10 0 4 12 54

-8 -1 2 4 -2

- 16 -1 0 -4 4 - 17

1º) Medias

ui = vj =

xi − O X xi − 17 ,5 ∑ ui H i ⋅ c = 17 ,5 + ⎛ − 5 ⎞ ⋅ 5 = 16,67 ⇒ x = OX + = ⎜ ⎟ 1 5 c1 N ⎝ 30 ⎠ y j − OY c2 = y j − 1.980 5
⇒ y = OY +

∑ v jG j ⋅ c
N

2

⎛ 14 ⎞ = 1.980 + ⎜ ⎟ ⋅ 5 = 1982 ,33 ⎝ 30 ⎠

2º) Varianzas y Desviaciones Típicas

2 SX

=

2 c1 ⎢

⎡ ∑ ui2 H i ⎢ ⎣ N

2 2 ⎛ ∑ ui H i ⎞ ⎤ 2 ⎡ 43 ⎛ − 5 ⎞ ⎤ −⎜ ⎟ ⎥ = 5 ⎢ − ⎜ ⎟ ⎥ = 35,139 ⎝ N ⎠ ⎥ ⎢ 30 ⎝ 30 ⎠ ⎥ ⎦ ⎣ ⎦

2 SY

=

2 c2 ⎢

⎡ ∑ v 2G j j ⎢ ⎣ N

⎛ ∑ v jG j ⎞ −⎜ ⎜ N ⎟ ⎟ ⎝ ⎠

2

2 ⎤ ⎤ ⎡ 2 54 ⎛ 14 ⎞ ⎥ = 5 ⎢ − ⎜ ⎟ ⎥ = 39 ,56 ⎥ ⎢ 30 ⎝ 30 ⎠ ⎥ ⎦ ⎣ ⎦

________________________________________________________________________________________________________________________ Página 94

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

3º) Covarianza

⎡ u A ⎛ u H ⎞ ⎛ ∑v jGj ⎞⎤ ⎡ −17 ⎛ − 5⎞ ⎛ 14⎞⎤ SXY = c1 ⋅ c2 ⎢ ∑ i i − ⎜ ∑ i i ⎟ ⋅ ⎜ ⎜ N ⎟⎥ = 5⋅ 5 ⎢ 30 − ⎜ 30 ⎟ ⋅ ⎜ 30⎟⎥ = − 12,22 ⎟ ⎝ ⎠ ⎝ ⎠⎦ ⎝ N ⎠ ⎝ ⎣ ⎠⎦ ⎣ N
4º) Rectas de Regresión

Y

X

(y − y)

= b (x − x ) − 12 ,22 (x − 16,67 ) ⇒ 35,139 yi = 1.988,11 − 0,347 xi

y − 1.982 ,33 =

X

Y

⇒ ( x − x ) = b' ( y − y ) x − 16,67 = − 12 ,22 ( y − 1.982,33) ⇒ 39 ,56

xi = 628,81 − 0,3088 yi

5º) Coeficiente de Determinación y Coeficiente de Correlación Lineal

R

2

(S XY )2 =
S xy
2 2 Sx ⋅ S y

2 2 S X ⋅ SY

=

(− 12 ,22)2
35,139 ⋅ 39 ,56

≅ 0,1074 ⇒ Incorrelación

r=

=

− 12 ,22 = − 0,3277 35,139 ⋅ 39 ,56

________________________________________________________________________________________________________________________ Página 95

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

PREGUNTAS TIPO TEST
1º- Un empleado percibe un salario bruto de 2.200 u.m., del que Hacienda le retiene el 15%. Si se produce un incremento del salario del 3,5% ¿Cuál será su sueldo neto? a) 1.929,51 u.m. b) 1.935,45 u.m. c) 2.270,25 u.m. 2º- ¿Cuándo se puede realizar un cambio de variable? a) Cuando los valores de la variable se incrementen de uno en uno. b) Siempre. c) Cuando los valores de la variable no son negativos. 3º- En un modelo de regresión lineal obtenemos R2 = 0,95 ¿Cuál de las siguientes opciones es compatible con este resultado? a) S e = 5 ⇒ S b) S e = 5 c) S e = 5
2
2 2 2 Y* 2 ⇒S * Y 2 ⇒S * Y

= 25 = 95

= 20

4º- ¿Cuál de los siguientes resultados es compatible con la recta Y = 5 + 2X?

a) S XY = 10 ⇒ S X = 5

2

b) S XY = −10 ⇒ S X = −5 c) S XY = −10 ⇒ S X = 5
5º- ¿Cuál de las siguientes medidas no es de tendencia central? a) La mediana. b) El tercer cuartel. c) La media armónica. 6º- El índice de Gini sirve para determinar a) La dispersión de un conjunto de observaciones. b) La igualdad en el reparto de una magnitud. c) La forma en que debemos repartir los salarios de los trabajadores de una empresa. 7º- El precio de un bien se ha incrementado en un 1% en cada uno de los meses del año 2.003 ¿Cuál ha sido su incremento total durante este año? a) 12,22% b) 12,55% c) 12,66%
2

2

________________________________________________________________________________________________________________________ Página 96

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

8º- El salario medio de los trabajadores de una empresa A es de 10.000 € y el de la empresa B 15.000 €. Si el número de trabajadores de A es la mitad que el de B. ¿Cuál es el salario medio de las dos empresas? a) 12.000 € b) 12.666 € c) 13.333 € 9º- Al jefe de ventas de una empresa exportadora de vino le plantean el objetivo anual de vender 1 millón de unidades a un precio medio de 5 €. Si durante el primer semestre ha logrado vender 400.000 unidades a un precio medio de 5,65 € ¿A que precio medio debe vender el resto de las unidades para lograr su objetivo? a) 4,535 € b) 4,567 € c) 4,525 € 10º- En el análisis de un modelo de regresión ¿Cuál de los siguientes resultados puede ser aceptable? a) Y = 3 – 2X con r = 0,96.

b) X = 8,1 + 0,2Y con X = 1 y Y = 3. c) Z = Y – 1,7T con r = - 0,73.

11º- En un estudio sociológico se clasifica la clase social de cada encuestado con los valores 0, 1 y 2 (baja, media y alta). Si sabemos que la media es 0,75 y la moda vale 1, se puede afirmar: a) Un 75% de los encuestados es de clase baja. b) Se ha encontrado más gente de clase alta que de clase baja. c) Se ha encontrado más gente de clase baja que de clase alta. 12º- Si dada una variable todos los valores los multiplicamos por una constante K: a) La varianza queda multiplicada por dicha constante. b) La desviación típica queda multiplicada por dicha constante c) La desviación típica no varía. 13º- Dadas las observaciones: - 10 ; 3 ; X ; 10 ; 1 ; 0, se sabe que la desviación típica coincide con el Coeficiente de Variación de Pearson. ¿Cuánto vale X? a) 2 b) 4 c) 3 14º- Un alumno responde que si los coeficientes de regresión de una distribución bidimensional son -3 y 1 3 , entonces la correlación es perfecta, es decir r = - 1 ¿Es correcto este razonamiento? a) Si. b) No. c) Depende de los valores que tomen las variables.

________________________________________________________________________________________________________________________ Página 97

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

15º- Al realizar la regresión entre las variables X e Y se ha obtenido el siguiente resultado: Y= 5 + 3X. Si sabemos que X = 2 ¿Cuánto vale Y ? a) 11 b) 12 c) 13 16º- Si dos variables X e Y tienen un coeficiente de correlación negativo. Podemos afirmar que: a) Cuando la variable X crece la variable Y crece. b) Cuando la variable X decrece la variable Y crece. c) Cuando la variable X decrece la variable Y decrece. 17º- El índice de Gini es una medida que nos informa de a) La evolución de los salarios de los empleados de una determinada empresa. b) La forma más o menos equitativa en que se ha realizado el reparto de una determinada magnitud. c) La dispersión que presenta un determinado conjunto de datos. 18º- Dada una recta de regresión de X/Y: X = 2 - 0,4Y , y la recta de regresión de Y/X: Y = 2 – 0,1X, el Coeficiente de Correlación Lineal entre las variables es igual a: a) – 0,2 b) 0,2 c) – 0,04 19º- Una variable estadística tiene concentración máxima cuando: a) El índice de Gini vale 1. b) La curva de Lorenz esta lo mas alejada posible de la bisectriz del primer cuadrante. c) Las dos anteriores son ciertas. 20º- En una clase de preescolar, 5 niños no tiene ningún hermano, 10 tienen 1 hermano, 12 tienen 2 hermanos y 3 niños tienen 3 hermanos. La mediana del número de hermanos es: a) 1 b) 2 c) 1,5 21º- La Varianza de una distribución de frecuencias es un indicador de: a) El grado de concentración de la variable. b) El grado de dispersión de los valores de la variable entorno a un valor medio. c) El grado de dispersión de los valores de la variable respecto de la Mediana. 22º- Un hotel espera aumentar sus ventas del próximo año en un 20%, ¿en que porcentaje debe incrementar los precios para que el ingreso total se incremente en un 30%? a) En un 9,222% b) En un 8,333% c) En un 7,444% 23º- ¿Cuál de las siguientes propiedades cumple la media aritmética? a) Si a todos los valores de una variable le sumamos la cantidad fija K la media de esta nueva variable disminuye en esa misma cantidad. b) La suma de las desviaciones de los valores de la variable respecto a la media es cero. c) La suma de las desviaciones al cuadrado de los valores de la variable respecto a la media es cero.

________________________________________________________________________________________________________________________ Página 98

©AJR

CURSO BASICO DE ESTADISTICA DESCRIPTIVA_____________________________

24º- ¿Cuál es el índice de Gini de la siguiente distribución: xi: 1 5 10 ni: 5 5 5 a) 0,5624 b) 0,2823 c) 0,3845 25º- La media, la mediana y la moda de una distribución: a) Pueden calcularse cuando es una variable cualitativa. b) Pueden calcularse cuando es una variable cuantitativa. c) En todas las distribuciones su valor coincide. 26º- Tipificar una variable sirve para: a) Comparar la dispersión de varias distribuciones. b) Comparar valores que pertenecen a distintas distribuciones. c) Obtener una distribución de media igual a 1. 27º- ¿Cuál de las siguientes distribuciones sobre los precios de las habitaciones de un hotel es más homogénea? a) Una que tiene de media 30 € y desviación típica 5 €. b) Una de media 30 € y desviación típica 64 €. c) Una de media 30 € y coeficiente de desviación 42%. 28º- Si estudiamos la relación entre las variables Precio y Demanda, de un artículo: a) La variable dependiente puede ser el Precio. b) La variable dependiente puede ser la Demanda. c) La pendiente de la recta de regresión puede ser negativa. 29º- Existe una relación causa-efecto entre dos variables: a) Existe una relación cuantitativa entre ambas variables. b) Existe una relación cualitativa entre ambas variables. c) Cuando existe relación cuantitativa y la teoría soporta esta relación. 30º- Si al realizar la regresión entre los precios de los menús de diferentes restaurantes y el número de clientes que lo han solicitado nos da el Coeficiente de Determinación igual al 95%, esto quiere decir: a) Que el 95% de los clientes eligen el menú del día. b) Que pueden realizarse predicciones con un 95% de fiabilidad. c) Que el 5% de la variación de una variable puede explicarse por el ajuste realizado.

SOLUCIONES TEST
01 – B 02 – B 03 – B 04 – A 05 – B 06 – B 07 – C 08 – C 09 – B 10 – C 11 – C 12 – B 13 – A 14 – B 15 – A 16 – B 17 – B 18 – A 19 – C 20 – B 21 – B 22 – B 23 – B 24 – A 25 – B 26 – B 27 – A 28 – B 29 – C 30 – B

________________________________________________________________________________________________________________________ Página 99

©AJR

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->