Está en la página 1de 23

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

: ESTADSTICA EMPRESARIAL: UN ENFOQUE APLICADO

2 Diplomatura de Empresariales

EJERCICIOS RESUELTOS Estadstica descriptiva para una variable


Contenido: Pgina

Enunciados de los ejercicios .................................................................................................... 2 Resultados SPSS correspondientes a los ejercicios ................................................................. 4 Resolucin de los ejercicios ................................................................................................... 11 Los resultados de SPSS necesarios para resolver los 22 primeros ejercicios se han obtenido con el

fichero de datos de 175 escolares, mientras que los ejercicios del 23 al 36 corresponden con resultados de un fichero de empleados de USA y los ltimos 4 ejercicios se refieren a los resultados sobre las ventas en un fichero de 20 empresas. Todos los resultados se encuentran al final de los enunciados de los ejercicios. Fichero de 175 escolares: 1.- Calcula los valores de la tabla de frecuencias de la variable ESTUDIOS. Interpreta su significado (bien mediante la tabla o bien mediante el grfico de barras). 2.- Calcula el valor de la medida de posicin central ms adecuada para la variable ESTUDIOS. Interpreta su significado. 3.- Calcula los valores de la tabla de frecuencias de la variable NIVEL. Interpreta su significado (bien mediante la tabla o bien mediante el grfico de barras). 4.- Calcula las medidas de posicin central adecuadas para la variable NIVEL. Interpreta su significado. Cul es la ms adecuada? 5.- Seala la razn por la que las columnas Porcentaje y Porcentaje vlido son iguales para la variable ESTUDIOS y distintas para NIVEL.
Pgina 1

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

6.- Qu otros estadsticos tendra sentido calcular para las variables ESTUDIOS y NIVEL? 7.- Interpreta el diagrama de barras de la variable EDAD. 8.- Calcula los valores de los estadsticos faltantes (Mximo, Suma y Varianza) para la variable EDAD. 9.- Seala los valores, unidades y significado de las medidas de posicin central, dispersin y forma calculadas para la variable EDAD. 10.- Interpreta el histograma de la variable CINE (Asistencia anual al cine). 11.- Calcula los valores de los estadsticos faltantes (Mediana, Desv.Tp., Suma y Rango) para la variable
CINE.

12.- Analiza mediante varias formas la existencia de valores extremos en la variable CINE. 13.- Seala las medidas de posicin (central y no centrales) calculadas para la variable CINE e interpreta su significado. Cul es la ms adecuada para resumir los valores de dicha variable? 14.- Construye de forma aproximada el diagrama de cajas para la variable CINE y comntalo. 15.- Seala los valores, unidades y significado de las medidas de dispersin y forma calculadas para la variable CINE. 16.- Calcula el intervalo en el que se encuentran al menos el 75% y aproximadamente el 95% de los datos de la variable CINE. 17.- Seala el valor y significado de la medida de posicin central ms adecuada para la RIQUEZA VERBAL (Analiza la existencia de extremos si lo crees necesario). 18.- Seala el valor y significado de las medidas de forma de la variable RIQUEZA VERBAL. 19.- Seala los valores y unidades de las medidas de dispersin absolutas calculadas para la variable
RIQUEZA VERBAL.

Cmo calcularas otras medidas de dispersin absolutas con el ordenador?

20.- Seala los valores que forman el primer intervalo y el ltimo en el diagrama de Tallos y Hojas (Stemand-Leaf Plot) de la RIQUEZA VERBAL. 21.- Comenta el diagrama de cajas dibujado para la RIQUEZA VERBAL. 22.- Compara la dispersin de las tres variables cuantitativas (EDAD, CINE y RIQUEZA VERBAL), utilizando la medida ms adecuada, y seala la frmula y valores utilizados para calcularla. Fichero de empleados de USA: 23.- Indica de qu tipo son las variables Contratos anuales firmados, Categora laboral y Salario actual. 24.- Calcula los estadsticos borrados y la amplitud intercuartil de los Contratos anuales firmados.

Pgina 2

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

25.- Interpreta todas las medidas de posicin de los Contratos anuales firmados. Cul es la medida de posicin central ms adecuada para resumir esta variable? 26.- Estn dispersos los valores de los Contratos anuales firmados? Por qu? Dnde se localiza un poco ms de dispersin? 27.- Calcula los valores borrados en la tabla de frecuencias de Categora laboral. 28.- Calcula e interpreta la medida de posicin central ms adecuada para la Categora laboral. 29.- Tiene sentido calcular otros estadsticos para Categora laboral? Por qu? 30.- Analiza la distribucin de los valores del Salario actual a partir de los cuartiles. Crees que existen valores extremos? 31.- Analiza con valores tipificados si el Salario actual tiene valores extremos. 32.- Cul es la medida de posicin central ms adecuada para resumir el Salario actual? Interprtala. 33.- Indica los valores, unidades e interpretacin de las medidas de dispersin del Salario actual. 34.- En qu intervalo se encuentra aproximadamente el 68% de los valores del Salario actual segn la regla emprica? En qu intervalo tendremos aproximadamente el 95% de los datos? 35.- Compara la dispersin de las dos variables cuantitativas del estudio de empleados de USA. 36.- Interpreta las medidas de forma del Salario actual y su asimetra respecto de la mediana. Fichero de 20 empresas: 37.- Interpreta el significado de las medidas de posicin no central calculadas para las Ventas y analiza la distribucin de los valores de las Ventas a partir de los cuartiles. 38.- Seala los valores que forman el primer intervalo y el ltimo en el diagrama de Tallos y Hojas (Stemand-Leaf Plot) de las Ventas. 39.- Analiza si las Ventas tiene valores extremos. Cul es la medida de posicin central ms adecuada para resumir las Ventas? 40.- Indica los valores, unidades e interpretacin de las medidas de dispersin de las Ventas.

Pgina 3

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Resultados de SPSS para resolver los ejercicios de 175 escolares


Tabla de frecuencia ESTUDIOS Frecuencia 53 71 51 175 175 Porcentaje ----------100,0 100,0 Porcentaje vlido ---------100,0 Porcentaje acumulado ----------

Vlidos

EGB BUP FP Total

Total
Grfico de barras
80

60

40

Frecuencia

20

0 EGB BUP FP

ESTUDIOS

Tabla de frecuencia NIVEL SOCIOECONOMICO FAMILIAR Frecuencia 19 50 57 31 11 168 7 7 175 Porcentaje ----------------100,0 Porcentaje vlido ----------100,0 Porcentaje acumulado -----------

Vlidos

Perdidos Total

MUY BAJO BAJO MEDIO ALTO MUY ALTO Total 9 Total

Grfico de barras
60

50

40

30

20

Frecuencia

10

0 MUY BAJO BAJO MEDIO ALTO MUY ALTO

NIVEL SOCIOECONOMICO FAMILIAR

Pgina 4

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Anlisis descriptivo de la variable EDAD (175 escolares)

Grfico de barras
50

40

30

20

Frecuencia

10

0 12 13 14 15 16 17 18 20

EDAD
Estadsticos descriptivos N Estadstico 175 175 Rango Estadstico 8 Mnimo Estadstico 12 Mximo Estadstico ----Suma Estadstico ----Media Estadstico 15,75

EDAD N vlido

Estadsticos descriptivos Desv. tp. Estadstico 1,81 Varianza Estadstico ----Asimetra Estadstico -,172 Curtosis Estadstico -,152

EDAD

Pgina 5

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Anlisis descriptivo de la variable ASISTENCIA ANUAL AL CINE (175 escolares)

Estadsticos Asistencia anual al cine N Vlidos Perdidos Media Mediana Moda Desv. tp. Varianza Asimetra Curtosis Rango Mnimo Mximo Suma Percentiles 25 50 75 175 0 28,39 -----12 -----283,963 ,547 -,530 -----5 70 -----12,00 26,00 40,00

Histograma
60

50

40

30

20

Frecuencia

10 0 10,0 20,0 30,0 40,0 50,0 60,0 70,0

Desv. tp. = 16,85 Media = 28,4 N = 175,00

ASISTENCIA ANUAL AL CINE

Pgina 6

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Anlisis descriptivo de la variable RIQUEZA VERBAL (175 escolares)


Descriptivos Estadstico 30,78 29,71 31,84 30,71 Error tp. ,54

RIQUEZA VERBAL

Media Intervalo de confianza para la media al 95% Media recortada al 5%

Lmite inferior Lmite superior

Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis

30,00 51,209 7,16 18 45 27 11,00 ,318 -,851 ,184 ,365

RIQUEZA VERBAL Stem-and-Leaf Plot Frequency 9,00 ,00 10,00 45,00 ,00 16,00 14,00 25,00 13,00 9,00 4,00 13,00 9,00 8,00 Stem width: Each leaf: Stem 1 2 2 2 2 2 3 3 3 3 3 4 4 4 10 1 case(s) & . . . . . . . . . . . . . . Leaf 888889999 3333333333 444444444444444444444444444444445555555555555 8888888899999999 00000000011111 2222222222223333333333333 4444444445555 777777777 8888 0000111111111 333333333 44445555

Pgina 7

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.


50

Estadstica unidimensional .Ejercicios

40

30

20

10
N= 175

RIQUEZA VERBAL

Resultados de SPSS para resolver los ejercicios de empleados de USA


Estadsticos Contratos anuales firmados N Vlidos Perdidos Media Mediana Moda Desv. tp. Varianza Asimetra Curtosis Rango Mnimo Mximo Percentiles 25 50 75

90 0 6,06 6,00 6 1,15 1,33 ,113 -,798 4 4 8 5,00 6,00 7,00

35 30 25 20 15 10 Porcentaje 5 0 4 5 6 7 8

Contratos anuales firmados

Pgina 8

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Categora laboral Porcentaje vlido 73,3 8,1 18,6 100,0 Porcentaje acumulado 73,3 81,4 100,0

Vlidos

Perdidos Total

Administrativo Seguridad Directivo Total 0

Frecuencia 63 7 16 86 4 90

Porcentaje 70,0 7,8 17,8 95,6 4,4 100,0

Descriptivos (90 casos vlidos, 0 casos perdidos) Estadstico 37202,06 35368,64 30750,00 322952647,132 17970,88 16800 110625 93825 21356,25 1,646 2,955

Salario actual (en dlares)

Media Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis

Percentiles Percentiles 50 30750,00

5 Promedio ponderado Salario actual (en dlares) 20062,50

25 24300,00

75 45656,25

95 72968,75

Pgina 9

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.


120000
90

Estadstica unidimensional .Ejercicios

100000
89 88

80000

87

60000

40000

20000

0
N = 90

Salario actual (en d

Pgina 10

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Resultados de SPSS para resolver los ejercicios de 20 empresas

Estudio de Frecuencias de la variable VENTAS (20empresas)


Estadsticos Ventas anuales en millones N Vlidos Perdidos Media Error tp. de la media Mediana Moda Desv. tp. Varianza Asimetra Error tp. de asimetra Curtosis Error tp. de curtosis Rango Mnimo Mximo Suma Percentiles 25 50 75

20 0 506,5640 65,2017 429,1050 258,33a 291,5908 85025,1964 2,810 ,512 9,699 ,992 1316,87 258,33 1575,20 10131,28 314,0375 429,1050 607,6850

a. Existen varias modas. Se mostrar el menor de los valores.

VENTAS ANUALES EN MILLONES Stem-and-Leaf Plot Frequency Stem 4,00 2 3,00 3 7,00 4 1,00 5 2,00 6 2,00 7 1,00 Extremes Stem width: Each leaf: & . . . . . . Leaf 5899 047 1223448 3 37 07 (>=1575)

100,000 1 case(s)

Pgina 11

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

RESOLUCION DE LOS EJERCICIOS DE ESTADISTICA DESCRIPTIVA

Fichero de 175 escolares: 1.- Calcula los valores de la tabla de frecuencias de la variable ESTUDIOS. Interpreta su significado (bien mediante la tabla o bien mediante el grfico de barras).
Los valores faltantes de la tabla de frecuencias se calculan de la forma siguiente: Porcentaje y Porcentaje vlido: se divide la frecuencia entre 175 y se multiplica por cien (en porcentaje) Porcentaje acumulado: se van sumando los porcentajes vlidos de la fila ms los de las anteriores filas.
Tabla de frecuencia ESTUDIOS Porcentaje vlido 30,3 40,6 29,1 100,0 Porcentaje acumulado 30,3 70,9 100,0

Vlidos

EGB BUP FP Total

Frecuencia 53 71 51 175 175

Porcentaje 30,3 40,6 29,1 100,0 100,0

Total

La interpretacin de la tabla de frecuencias, que quiz se ve ms claro en el diagrama de barras, sera que el grupo ms numeroso es el de alumnos de BUP (ms de un 40% de los estudiantes), mientras que los que estudian EGB es un grupo similar a los de FP, alrededor de un 30% de los encuestados.

2.- Calcula el valor de la medida de posicin central ms adecuada para la variable ESTUDIOS. Interpreta su significado.
La medida de posicin central ms adecuada para la variable estudios es la Moda, ya que es una variable cualitativa nominal (sus valores son categoras sin orden). Su valor es Moda=BUP y significa que el grupo ms numeroso de alumnos lo forman los que estudian BUP.

3.- Calcula los valores de la tabla de frecuencias de la variable NIVEL. Interpreta su significado (bien mediante la tabla o bien mediante el grfico de barras).
Los valores faltantes de la tabla de frecuencias se calculan de la forma siguiente: Porcentaje: se divide la frecuencia entre 175 y se multiplica por cien (en porcentaje) Porcentaje vlido: se divide la frecuencia entre 168 y se multiplica por cien (en porcentaje) Porcentaje acumulado: se van sumando los porcentajes vlidos de la fila ms los de las anteriores filas.

Pgina 12

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Tabla de frecuencia NIVEL SOCIOECONOMICO FAMILIAR Porcentaje vlido 11,3 29,8 33,9 18,5 6,5 100,0 Porcentaje acumulado 11,3 41,1 75,0 93,5 100,0

Vlidos

MUY BAJO BAJO MEDIO ALTO MUY ALTO Total

Frecuencia 19 50 57 31 11 168 7 7 175

Porcentaje 10,9 28,6 32,6 17,7 6,3 96,0 4,0 4,0 100,0

Perdidos Total

9 Total

La interpretacin de la tabla de frecuencias, que quiz se ve ms claro en el diagrama de barras, sera que el grupo ms numeroso es el de nivel medio, como era de esperar, decreciendo el nmero conforme aumenta o disminuye el nivel socioeconmico familiar, siendo el grupo de nivel alto el menos numeroso.

4.- Calcula las medidas de posicin central adecuadas para la variable NIVEL. Interpreta su significado. Cul es la ms adecuada?
Las medidas de posicin central que se pueden calcular para la variable nivel socioeconmico familiar son la Moda y la Mediana, ya que es una variable cualitativa ordinal (sus valores son categoras ordenadas), siendo la ms adecuada la mediana. Sus valores son Moda=Mediana=Nivel medio y significa que el grupo ms numeroso de personas lo forman los del nivel socioeconmico familiar Medio (moda) y la mitad de las personas tienen nivel medio o inferior (mediana).

5.- Seala la razn por la que las columnas Porcentaje y Porcentaje vlido son iguales para la variable
ESTUDIOS y distintas

para NIVEL.

Para la variable estudios las dos columnas de porcentajes son iguales ya que no hay valores perdidos. En cambio para la variable nivel socioeconmico familiar son distintas porque hay 7 valores perdidos. Esto es debido a que el Porcentaje se calcula dividiendo la frecuencia entre el nmero de casos totales y el Porcentaje vlido se calcula dividiendo la frecuencia entre el nmero de casos vlidos ( ambos en porcentaje)

6.- Qu otros estadsticos tendra sentido calcular para las variables ESTUDIOS y NIVEL?
Para ninguna de las dos variables se pueden calcular ms estadsticos que los sealados en las preguntas 2 y 4 ya que se trata de variables cualitativas y para ellas nicamente tienen sentido las medidas de posicin central sealadas: la moda para la variable ESTUDIOS y la mediana y la moda para NIVEL.
Pgina 13

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios 7.- Interpreta el diagrama de barras de la variable EDAD.

En el diagrama de barras de la edad se observa que sobre todo hay gente de 15 a 18 aos, siendo el grupo de gente de 16 aos el ms numeroso, mientras que de 12 a 14 aos y de 20 aos hay muy pocos.

8.- Calcula los valores de los estadsticos faltantes (Mximo, Suma y Varianza) para la variable EDAD.
Los valores faltantes hay que calcularlos a partir del resto de valores obtenidos por SPSS como sigue: Mximo=Rango+Mnimo=8+12=20 aos Suma= 2756 aos, ya que es igual a Media*(N vlido)=15,75*175=2756,25 pero se redondea ya que la edad no tiene decimales. Varianza es el cuadrado de la desviacin tpica, luego Varianza = 1,81 = 3, 28aos

9.- Seala los valores, unidades y significado de las medidas de posicin central, dispersin y forma calculadas para la variable EDAD.
Medidas de posicin central: Media=15,75 aos, significa que la edad media de los estudiados es 15,75 aos (casi 16 aos).
*2 2 Medidas de dispersin: Varianza ( SPSS ) = S x = 3, 28aos

* DesviacinTpica ( SPSS ) = S x = 1,81aos

Significa que hay muy poca dispersin, ya que la desviacin tpica es mucho menor que la media (y por tanto el coeficiente de variacin ser mucho menor que 1). Medidas de forma: (ambas sin unidades) Asimetra=-0,172: al ser negativa significa que la grfica es asimtrica por la izquierda de la media y por tanto los valores menores que 15,75 aos (media) estn ms dispersos que los mayores. Curtosis=-0,152: al ser negativa significa que la grfica es menos apuntada que la campana de gauss (Grfica de la distribucin normal) y por tanto los valores alrededor de 15,75 aos (media) estn menos concentrados que en la distribucin Normal.

10.- Interpreta el histograma de la variable CINE (Asistencia anual al cine).


En histograma de la asistencia anual al cine se observa que el grupo ms numeroso es el que menos ha ido al cine (menos de 15 veces al ao) y que al aumentar el nmero de veces que ha ido al cine, el nmero de persona desciende, siendo el menos numeroso el de los que han ido 65 veces o ms en un ao.

Pgina 14

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. CINE.

Estadstica unidimensional .Ejercicios

11.- Calcula los valores de los estadsticos faltantes (Mediana, Desv.Tp., Suma y Rango) para la variable

Los valores faltantes hay que calcularlos a partir del resto de valores obtenidos por SPSS como sigue: Mediana=Percentil 50= 26 veces Suma= 4968 veces, ya que es igual a Media*(N vlido)=28,39*175=4968,25 pero redondeado, ya que la variable cine no tiene decimales. La desviacin tpica es la raz de la varianza, luego Desv.tp. = Rango=Mximo-Mnimo=70-5=65 veces

283,963 = 16 ,8512 veces

12.- Analiza mediante varias formas la existencia de valores extremos en la variable CINE.
Hay tres formas posibles, si bien cada una de ellas nos ofrece distinta informacin: a) Comparacin de rango y amplitud intercualtil: Como tenemos Rango=65 y Amplitud Intercuartil=40-12=28 veces, Rango=65<4 A.I.=112, luego no hay extremos (sta es la forma ms sencilla de ver que no hay extremos) b) Valores tipificados del mnimo y el mximo: Mnimo=5 veces tipificado: z min =

5 28,39 16,85

= 1,388 > 3

luego el mnimo no es un valor

extremo (y por tanto no hay extremos en los valores bajos de la variable CINE) Mximo=70 veces tipificado: z max =

70 28,39 16,85

= 2, 469 < 3

luego el mximo no es un valor

extremo (y por tanto no hay extremos en los valores altos de la variable CINE). c) Comparacin de diferencias entre los cuartiles: Min=5 P25=12 Me=26 P75=40 Max=70

|-------------------|-------------------|-------------------|-------------------| dif.1=7 dif.2=14 dif.3=14 dif.4=30

Tomando como referencia las dos diferencias centrales (dif.2 y dif.3) vemos que: - la diferencia del primer 25% de los datos (dif.1) es menor que las centrales, luego no hay valores extremos en los valores bajos de la variable CINE. (P25-Min<A.I.<3 A.I.) - la diferencia del ltimo 25% de los datos (dif.4) es algo mayor que las centrales, pero no exageradamente grande, luego en los valores altos de la variable CINE no hay valores extremos, aunque s hay una mayor dispersin. (Max-P75<A.I.<3 A.I.)

13.- Seala las medidas de posicin (central y no centrales) calculadas para la variable CINE e interpreta su significado. Cul es la ms adecuada para resumir los valores de dicha variable?
Pgina 15

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Mnimo=5 veces y Mximo=70 veces

significa que el que menos ha ido al cine ha ido 5 veces en

un ao y el que ms 70 veces (ms de una vez a la semana). Media=28,39 veces 28,39 veces en un ao. Mediana=26 veces Moda=12 veces la mitad de la gente ha ido como mucho 26 veces al cine en un ao. el grupo ms numeroso es el que ha ido 12 veces al cine en un ao (no tiene significa que el nmero medio de veces que han ido al cine estas personas es

demasiada utilidad en cuantitativas). Percentil 25=12 veces Percentil 75=40 veces la cuarta parte de la gente ha ido 12 veces al ao al cine o menos. la cuarta parte de la gente ha ido 40 veces al ao al cine o ms.

La ms adecuada es la media aritmtica, ya que CINE es una variable cuantitativa sin valores extremos.

14.- Construye de forma aproximada el diagrama de cajas para la variable CINE y comntalo.
La construccin del diagrama de cajas se realiza a partir de los valores de los cuartiles y se comenta a partir de las diferencias entre dichos cuartiles. Por tanto, dibujamos el diagrama de cajas (en horizontal) del modo siguiente: Min=5 P25=12------------Me=26-----------P75=40 Max=70 |--------------| | |-----------------------------------------------| --------------------------------------dif.1=7 dif.2=14 dif.3=14 dif.4=30 Una vez calculadas las diferencias entre los cuartiles podemos decir que: - la diferencia del primer 25% de los datos (dif.1) es la menor, luego el 25% de los datos ms pequeos estn ms concentrados, mientras que la mayor es dif.4, luego el 25% de los valores ms altos estn ms dispersos. El 50% de los datos centrales (alrededor de la mediana) tienen una dispersin intermedia entre los dos anteriores. - hay asimetra por la derecha de la mediana: los valores de asistencia anual al cine mayores que 26 veces estn ms dispersos que los menores.

15.- Seala los valores, unidades y significado de las medidas de dispersin y forma calculadas para la variable CINE.
Medidas de dispersin:

* *2 2 DesviacinTpica ( SPSS ) = S x = 16 ,8512 veces Varianza ( SPSS ) = S x = 283,963veces


Significa que la dispersin de los datos es de 16,85 veces al cine, y hay poca dispersin, ya que la desviacin tpica es menor que la media (y por tanto el coeficiente de variacin ser menor que 1). Medidas de forma: (ambas sin unidades) Asimetra=0,547: al ser positiva significa que la grfica es asimtrica por la derecha de la media y por tanto los valores mayores que 28,39 veces (media) estn ms dispersos que los menores.
Pgina 16

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Curtosis=-0,53: al ser negativa significa que la grfica es menos apuntada que la grfica de la distribucin normal y por tanto los valores alrededor de 28,39 veces (media) estn menos concentrados que en la distribucin Normal.

16.- Calcula el intervalo en el que se encuentran al menos el 75% y aproximadamente el 95% de los datos de la variable CINE.
Segn la regla de Tchebichev y la regla emprica, en

[x 2S

* * x , x + 2 S x estn al menos el 75% de

los datos y aprox. el 95% de los datos, respectivamente. Por tanto para la variable CINE el intervalo que buscamos ser: [ 28,39 - 2 16,8512 , 28,39 + 2 16,8512 ] = [ -5, 3124 , 62,0924 ] y como la variable CINE es discreta y mnimo=5, el intervalo ser: [ 5 , 62 ].

17.- Seala el valor y significado de la medida de posicin central ms adecuada para la RIQUEZA VERBAL (Analiza la existencia de extremos si lo crees necesario).
La medida de posicin central ms adecuada es la media aritmtica, ya que la Riqueza verbal es una variable cuantitativa (discreta) y en el diagrama de cajas se puede ver que no tiene valores extremos.

18.- Seala el valor y significado de las medidas de forma de la variable RIQUEZA VERBAL.
Asimetra=0,318 (sin unidades): al ser positiva significa que la grfica es asimtrica por la derecha de la media y por tanto las puntuaciones mayores que 30,78 puntos (media) estn ms dispersas que las menores. Curtosis=-0,851 (sin unidades): al ser negativa significa que la grfica es menos apuntada que la grfica de la distribucin normal y por tanto las puntuaciones alrededor de 30,78 puntos (media) estn ms dispersas que en la distribucin Normal.

19.- Seala los valores y unidades de las medidas de dispersin absolutas calculadas para la variable
RIQUEZA VERBAL.

Cmo calcularas otras medidas de dispersin absolutas con el ordenador?

Las medidas de dispersin absolutas calculadas por SPSS son: Rango = 27 puntos Amplitud intercuartil = 11 puntos

*2 2 Varianza ( SPSS ) = S x = 51, 209 puntos

* DesviacinTpica ( SPSS ) = S x = 7,16 puntos

Otra medida de dispersin absoluta que podramos calcular con el ordenador es la desviacin media respecto de la mediana. Para ello debemos seguir dos pasos: 1) Calcular la variable: Z = Valor absoluto de (Riqueza verbal mediana) = ABS (VERBAL 30) 2) Calcular la media de la variable anterior: Media de Z = Desviacin media respecto de la mediana

Pgina 17

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

20.- Seala los valores que forman el primer intervalo y el ltimo en el diagrama de Tallos y Hojas (Stemand-Leaf Plot) de la RIQUEZA VERBAL.
Los 9 valores del primer intervalo son: 18 (5 veces) y 19 (4 veces) Los 8 valores del ltimo intervalo son: 44 (4 veces) y 45 (4 veces) Esto es debido a que la anchura del tallo es 10 (Stem width) y la variable Riqueza verbal no tiene decimales. Por tanto los datos hay que calcularlos mediante: Dato=Stem*10+Leaf.

21.- Comenta el diagrama de cajas dibujado para la RIQUEZA VERBAL.


En el diagrama de cajas se observa que no hay valores alejados (ni atpicos ni extremos) y que los datos estn casi uniformemente distribuidos en las 4 partes (de 25% de datos cada una), salvo el 25% de los datos mayores que estn un poco ms dispersos, con lo que la distribucin es un poco asimtrica por la derecha de la mediana.

22.- Compara la dispersin de las tres variables cuantitativas (EDAD, CINE y RIQUEZA VERBAL), utilizando la medida ms adecuada, y seala la frmula y valores utilizados para calcularla.
Para comparar la dispersin de las tres variables deberemos utilizar el coeficiente de variacin, ya que no le influye el hecho de que las variables tengan distintas unidades. Edad: CV (edad ) =
Sx x = * n 1 Sx = n x 174 1,81 175 15,75 = 0,1146

Asistencia anual al cine: CV (cine) =

Sx x

* n 1 Sx = n x

174 16,85 175 28,39

= 0,5918

Riqueza verbal: CV ( verbal ) =

Sx x

* n 1 Sx = n x

174 7,16 175 30,78

= 0,23195

Comparando los valores de los coeficientes de variacin podemos decir que todas las variables tienen poca dispersin, pero la que tiene la menor dispersin es la Edad y la que tiene una mayor dispersin es la asistencia anual al cine, mientras que la variable riqueza verbal tiene una dispersin intermedia a las dos anteriores.

Pgina 18

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Fichero de empleados de USA:

23.- Indica de qu tipo son las variables Contratos anuales firmados, Categora laboral y Salario actual.
La Contratos anuales firmados es una variable numrica y sin decimales, luego es cuantitativa discreta y adems con pocos valores distintos. La Categora Laboral es una variable de grupos sin ordenar, luego es cualitativa nominal. El Salario actual tambin es una variable numrica, pero con decimales, luego es una variable cuantitativa continua.

24.- Calcula los estadsticos borrados y la amplitud intercuartil de los Contratos anuales firmados.
Mediana = P(50) = 6 contratos Varianza = (Desv.tip) = (1,15) = 1,3225 contratos Rango = Mximo Mnimo = 8 4 = 4 contratos Amplitud Intercuartil = P(75) P(25) = 7 5 = 2 contratos
2 2 2

25.- Interpreta todas las medidas de posicin de los Contratos anuales firmados. Cul es la medida de posicin central ms adecuada para resumir esta variable?
Medidas de posicin central y su significado: Media = 6,06 : El nmero medio de contratos anuales firmados es de 6,6 contratos. Mediana = 6 : La mitad de los empleados han firmado 6 contratos anuales o menos (6, 5 4 contratos). Moda = 6 : El grupo ms numeroso es el que forman los que han firmado 6 contratos anuales. Medidas de posicin no central y su significado: Mnimo = 4 : Los empleados han firmado 4 contratos al menos. Mximo = 8 : Los empleados que ms contratos han firmado han firmado 8 contratos. Percentil 25 = 5 : El 25% de los empleados han firmado 5 contratos o menos. Percentil 75 = 7 : El 25% de los empleados han firmado 7 contratos o ms. La medida de posicin central ms adecuada para esta variable es la media aritmtica (6,06 contratos) ya que se trata de una variable cuantitativa discreta con pocos valores posibles (y por tanto, sin valores extremos).

26.- Estn dispersos los valores de los Contratos anuales firmados? Por qu? Dnde se localiza un poco ms de dispersin?
Los valores de esta variable estn muy poco dispersos, como se puede observar en el diagrama de barras y porque la desviacin tpica (1,15 contratos) es mucho menor que la media (6,06 contratos).

Pgina 19

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

Grficamente se aprecia un poco ms de dispersin en los valores altos, como se puede comprobar con el coeficiente de asimetra (0,113) un poco mayor que cero.

27.- Calcula los valores borrados en la tabla de frecuencias de Categora laboral.


Los cuatro valores borrados se calculan de la siguiente forma: Frecuencia de Directivo = Total vlido frecuencias de Administrativo y Seguridad = 86 (63+7) = 16 Porcentaje de Administrativo = ( Frecuencia / Total ) * 100 = ( 63 / 90 ) * 100 = 70 % Porcentaje vlido de Administrativo = ( Frecuencia / Total vlido ) * 100 = ( 63 / 86 ) * 100 = 73,2558 % = Porcentaje acumulado = 73,3 % Porcentaje acumulado de Seguridad = Porcentaje vlido de Administrativo + Seguridad = 73,3 + 8,1 = 81,4 %

28.- Calcula e interpreta la medida de posicin central ms adecuada para la Categora laboral.
La Categora Laboral es una variable cuantitativa nominal (grupos sin orden) luego la ms adecuada (y la nica que se puede calcular) es la moda, que en este caso es Administrativo y significa que el grupo ms numeroso es el de Administrativos (en este caso tambin es la mayora de empleados, ya que son el 73,3% de los casos vlidos).

29.- Tiene sentido calcular otros estadsticos para Categora laboral? Por qu?
Como se ha comentado en el ejercicio anterior, el nico estadstico que tiene sentido calcular es la Moda, por tratarse de una variable cualitativa nominal.

30.- Analiza la distribucin de los valores del Salario actual a partir de los cuartiles. Crees que existen valores extremos?
Min=16800 P25=24300 Me=30750 P75=45656,25 Max=110625 |----------------------------|----------------------------|----------------------------|----------------------------| dif.1=7500 dif.2=6450 dif.3=14906,25 dif.4=64968,75 Como se puede observar en lo anterior, el 25% de los salarios bajos tienen poca dispersin y los siguientes 25% tambin. A partir de la mediana (30.750 dlares) los salarios estn ms dispersos (son ms diferentes los valores), sobre todo en el 25% de salarios ms altos donde la dispersin es muy alta. Puede haber valores extremos en los salarios ms altos, ya que se ha observado una mayor dispersin. Para comprobarlo, comparamos la diferencia Max-P(75)=dif.4 con el triple de la amplitud intercuartil AI=6450+14906,25=21356,25: Max-P(75)=dif.4=64968,75 > 3 AI=64068,75 el mximo, al menos, es un valor extremo (como se

puede comprobar en el diagrama de cajas, en el que aparece un extremo y 3 valores alejados).


Pgina 20

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

31.- Analiza con valores tipificados si el Salario actual tiene valores extremos.
Tipificando el mximo y el mnimo del Salario comprobaremos si existen extremos altos o bajos, respectivamente:

zmin = zmax =

min x S* x max x
* Sx

= =

16800 37202,06 = 1,1353 > 3 luego el mnimo no es extremo. 17970,88 110625 37202,06 = 4,08 > 3 luego el mximo, al menos, es extremo. 17970,88

32.- Cul es la medida de posicin central ms adecuada para resumir el Salario actual? Interprtala.
Como el Salario es una variable cuantitativa continua, la ms adecuada ser una media, pero no la media aritmtica, ya que hemos comprobado en los ejercicios anteriores que hay un valor extremo. La media recortada eliminar el 5% de los valores altos y el 5% de los bajos, en este caso 5%n=5%90=4,5 datos, luego eliminar el valor extremo (e incluso los tres valores siguientes, que son los alejados en el diagrama de cajas), por lo que la media recortada al 5% (35.368,64) es la ms adecuada. Es decir, el salario medio de estos empleados es de 35.368,64 dlares.

33.- Indica los valores, unidades e interpretacin de las medidas de dispersin del Salario actual.
Rango = 93.825 dlares es la diferencia entre el que cobra el menor salario y el que cobra el mayor. Amplitud Intercuartil = 21.356,25 dlares : el 50% de salarios intermedios tienen una diferencia mxima de 21.356,25 dlares. Varianza (de SPSS) = 322.952.647,132 (dlares)
2

[no se interpreta]

Desviacin tpica (de SPSS) = 17.970,88 dlares es la dispersin de los salarios. Es poca dispersin porque es menor que la media (CV<1).

34.- En qu intervalo se encuentra aproximadamente el 68% de los valores del Salario actual segn la regla emprica? En qu intervalo tendremos aproximadamente el 95% de los datos?
Segn la regla emprica, en

[x S

* x, x

* + S x estn aproximadamente el 68% de los datos, es decir,

en [ 37.202,06 17.970,88 , 37.202,06 + 17.970,88] = [19.231,18 , 55.172,94 ] Tambin segn la regla emprica en

[x 2S

* * x , x + 2S x

] estn aproximadamente el 95% de los

datos, es decir, en [ 37.202,06 2 17.970,88 , 37.202,06 + 2 17.970,88] = [ 1.260,3 , 73.143,82 ], pero como el mnimo es 16.800, el intervalo con un 95% aprox. de los salarios ser [ 16.800 , 73.143,82 ]

Pgina 21

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

35.- Compara la dispersin de las dos variables cuantitativas del estudio de empleados de USA.
Las dos variables cuantitativas del fichero de empleados de USA son los Contratos anuales firmados y el Salario actual. Para poder compara su dispersin correctamente (tienen distintas unidades y muy distintos valores) debemos calcular el coeficiente de variacin de cada variable: Edad: CV (contratos) =

Sx x

* n 1 Sx 89 1,15 = = 0,1887 n x 90 6,06


Sx

* n 1 Sx 89 17970,88 Asistencia anual al cine: CV ( salario) = = = = 0,4804 n x 90 37202,06 x


Como era de esperar, el salario tiene mayor dispersin, porque su CV es mayor.

36.- Interpreta las medidas de forma del Salario actual y su asimetra respecto de la mediana.
Medidas de forma: Asimetra = 1,646 > 0: la grfica del salario ser asimtrica por la derecha de la media, es decir, los salarios mayores de 37.202,06 dlares estn ms dispersos que los menores. Curtosis = 2,955 > 0: la grfica del salario ser ms apuntada que la de la distribucin Normal, es decir, los salarios alrededor de 37.202,06 dlares (media) estn ms concentrados que en la Normal.

Fichero de 20 empresas: 37.- Interpreta el significado de las medidas de posicin no central calculadas para las Ventas y analiza la distribucin de los valores de las Ventas a partir de los cuartiles.
Mnimo = 258,33 millones : Las ventas han sido de258,33 millones al menos. Mximo = 1575,20 millones : Las ventas ms altas han sido de 1575,20 millones. Percentil 25 = 314,0375 : Las ventas del 25% de las empresas han sido 314.037.500 pts o menos. Percentil 75 = 607,6850 : El 25% de empresas han tenido unas ventas de 607.685.000 pts o ms. Distribucin de los valores (con diferencias aproximadas): Min=258,33 P25=314,0375 Me=429,105 P75=607,6850 Max=1575,2 |----------------------------|----------------------------|----------------------------|----------------------------| dif.1<60 dif.2=115 dif.3<180 dif.4>900 Se observa que el 25% de las empresas con menores ventas tienen una ventas ms similares y que al aumentar las ventas aumentan un poco las diferencias entre las de unas empresas y otras, en el 75% de las empresas de menores ventas. Sin embargo las ventas del 25% de las empresas con ventas ms altas muestran una diferencia muy grande, que es debida a una sola empresa con ventas muy altas como se puede comprobar en el diagrama de tallos y hojas.

Pgina 22

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO.

Estadstica unidimensional .Ejercicios

38.- Seala los valores que forman el primer intervalo en el diagrama de Tallos y Hojas (Stem-and-Leaf Plot) de las Ventas.
Como tenemos tallo(stem)=2 con anchura(Stem width)=100 y cada uno de los valores(Leaf)=5899, entonces los valores aproximados (slo se conocen dos cifras) son: 250, 280, 290 y 290.

39.- Analiza si las Ventas tiene valores extremos. Cul es la medida de posicin central ms adecuada para resumir las Ventas?
En primer lugar vamos a ver si es posible que haya extremos: Rango=1316,887>4 A.I.=4 293,6475=1174,59 luego no podemos afirmar que no hay extremos. Para analizar si hay extremos con los cuartiles (tambin se podra hacer con tipificados): Max-P75 = 1575,2 - 607,685 = 967,515 > 3 A.I. = 880,9425 luego hay algn valor extremo grande (al menos el mximo). En los valores bajos, el mnimo o cercanos, no hay valores extremos porque P25-Min<60<A.I. luego seguro que se cumple la condicin P25-Min < 3 A.I. de que no hay extremos. La medida de posicin central ms adecuada es una media, ya que ventas es una variable continua (numrica y con decimales), y no la media aritmtica puesto que acabamos de comprobar que las ventas tiene valores extremos. Para saber cul de las medias (recortada al 5% o geomtrica) se debe escoger, es necesario saber cuntos valores extremos hay. En este caso slo hay 1 valor extremo (el mximo=1575,2) ya que segn muestra el diagrama de tallos y hojas, el siguiente valor es aproximadamente 770, o como mucho 779,99, un valor muy cercano al P75 que no es extremo (799,99P75=192,305<3 A.I.). Como en este caso hay N=20 datos, el 5% supone un dato, luego la media recortada al 5% recorta el nico extremo y resulta por ello la medida de posicin central ms adecuada.

40.- Indica los valores, unidades e interpretacin de las medidas de dispersin de las Ventas.
Rango = 1316,887 millones es la diferencia mxima entre las ventas Amplitud Intercuartil =293,6475 millones: el 50% de las ventas intermedias tienen una diferencia mxima de 293.647.500 pts. Varianza (de SPSS) = 85025,1964 (millones)
2

[no se interpreta]

Desviacin tpica (de SPSS) = 291,5908 millones es la dispersin de las ventas. Es poca dispersin porque es menor que la media (CV<1).

Pgina 23

También podría gustarte