Está en la página 1de 20

Comuncate con nosotros.

481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe












SOFTWARE ESTAD STI CO SPSS



Tema N 22:


Medidas de resumen

Medidas de Tendencia central.
Medidas de tendencia no central
Medidas de Dispersin
Medidas de forma





Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe
























1. Reconoce y utiliza las medidas de tendencia central, no
central, de dispersin y de forma en SPSS.

Capacidad del Tema
Define e ingresa datos en SPSS y genera obtiene estadsticos
bsicos.
Conocimientos Previos
El Estudiante reconoce la importancia de saber determinar las
medidas de resumen que se pueden obtener en SPSS
mediante la formulacin de la siguiente pregunta: Qu tipo de
medidas de resmen podemos obtener de los datos obtenidos
de una poblacin o muestra?
Los Estudiantes mediante una lluvia de ideas van
determianndo las diferentes medidas de resmen que se
pueden obtener de un conjunto de datos.
Conflicto Cognitivo



Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe


22.1. INTRODUCCIN

La Estadstica Descriptiva es el primer paso en la investigacin de poblaciones o
conjunto de datos procedentes del recuento o de experimentos. Nos proporciona
herramientas que nos permiten resumir la informacin obtenida y pasar as de un
gran volumen de datos a otro ms reducido.

La Estadstica Descriptiva cubre un amplio conjunto de tcnicas y mtodos. En
este captulo contemplamos slo algunos conceptos, los ms elementales.

Las principales medidas que se estudian en la Estadstica Descriptiva son:

Medidas de Posicin
Medidas de Dispersin
Medidas de Asimetra y Curtosis
Medidas de Concentracin


22.2. MEDIDAS DE POSICION

Medidas de posicin central

Las medidas de posicin central ms comunes son: la media, la mediana, y la
moda. La media, a su vez, puede ser definida como media aritmtica,
geomtrica y armnica. Cada una de ellas presenta sus ventajas e
inconvenientes y su eleccin depende tanto de la naturaleza de la estadstica
como del propsito para el que se utiliza.

a) La media aritmtica. Es la suma de todos los valores de la variable dividida
por el nmero total de los datos.





Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

Ejemplo:


Las ventajas de utilizar la media aritmtica son:
En el clculo intervienen todos los valores de la variable
Es nica
Es calculable
Es el centro de gravedad de la distribucin.
Sin embargo est muy afectada por los valores extremos que presenten los
datos, lo que puede originar que a veces las conclusiones no sean muy atinadas.

b) La media geomtrica. Es la raz N-sima del producto de los valores de la
variable elevados por sus respectivas frecuencias.


La propiedad fundamental de esta media es que el logaritmo de la media
geomtrica es igual a la media aritmtica de los logaritmos de los valores de la
variable.
La principal ventaja que ofrece esta media respecto a la media aritmtica es su
menor sensibilidad respecto a los valores extremos de la variable. La desventaja
es que no est determinada si alguno de los valores de la variable es negativo.
Tambin tiene un significado menos intuitivo que la media aritmtica.



Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

Su utilizacin ms frecuente es promediar porcentajes, y tambin se aconseja su
uso cuando se presupone que la variable analizada se ha formado a partir de
variaciones acumulativas.

c) La media armnica. La media armnica es la media aritmtica de los
inversos de los valores de la variable.




En ciertos casos la media armnica es ms representativa que la media
aritmtica.
Tiene como inconvenientes que est muy influenciada por los valores pequeos
y no est determinada cuando algn valor de la variable es igual a cero.


d) La mediana. La mediana se encuentra en el lugar posicin central de
conjunto ordenado de datos, si el nmero de datos es impar. Cuando el nmero
de valores es par se toma la media aritmtica de los dos valores centrales.
La propiedad fundamental de la mediana es que la suma de todas las
desviaciones en valor absoluto de la variable respecto de la mediana es mnima.
La mediana adquiere mayor importancia cuando las variables son ordinales, o
susceptibles de ser ordenadas, en cuyo caso la mediana es la medida de
tendencia central ms representativa.




Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe


El Clculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la
frecuencia acumulada llega hasta la mitad de la suma de
las frecuencias absolutas.



Ejemplo:
fi Fi
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
<= Aqu se
encuentra
la mediana
[69, 72) 27 92
[72, 75) 8 100
100

Li = [66, 69) =66
N/2 = 100 / 2 =50

Ni-1 = 23

ni = 42

Ci = 3




Mediana =

=67,93



N/2 es la semisuma de las frecuencias
absolutas.
Li-1 es el lmite inferior de la clase
donde se encuentra la mediana.
Ni-1 es la frecuencia acumulada anterior
a la clase mediana.
ni la frecuencia del intervalo.
Ci es la amplitud de la clase.

66 +
5023
42
3



Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

d) La moda. Es el valor de la variable que ms veces se repite. Si existen dos o
ms valores empatados en el nmero de repeticiones, solo se muestra el ms
pequeo de ellos.

El Clculo de la moda para datos agrupados
Para distribuciones agrupadas en intervalos se utiliza la
siguiente frmula.









Ejemplo:
fi Fi
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65 <= Aqu se
encuentra
la moda
[69, 72) 27 92
[72, 75) 8 100
100

Li = [66, 69) =66

n i - 1 = 18

n i+1 = 27

Ci = 3




Mediana =

= 67,8







Li-1 es el lmite inferior de la clase
donde se encuentra la moda.
ni +1 la frecuencia del intervalo
posterior.
ni -1 la frecuencia del intervalo
anterior.
Ci es la amplitud de la clase.

66 +
27
18+27
3



Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

Medidas de posicin no central
Son medidas de posicin no central los cuartiles, deciles y percentiles. Las
medidas de posicin no centrales dividen la distribucin en partes iguales. Los
cuartiles son tres valores y dividen la distribucin en cuatro partes iguales. Los
deciles son nueve y dividen la distribucin en diez partes. Los percentiles son 99
y dividen la distribucin en cien partes.
Para distribuciones agrupadas en intervalos utilizamos la siguiente frmula:


Ejemplo 1:
A continuacin se realiza un ejercicio sencillo relacionado con las medidas de
posicin no centrales. El enunciado dice que se presentan los tiempos (en
minutos) logrados por 20 estudiantes, en una prueba de 200 metros planos. Nos
piden hallar los valores correspondientes al cuartil 1, 2 y 3. A parte de ello nos
piden responder para la serie de datos dada tiene sentido buscar
percentiles?Cmo procedemos a obtener los cuartiles en SPSS?


Teniendo en cuenta la lista de valores:


2 2,6 1,9 2
1,3 1,2 2,4 1,6
1,7 2,8 2,2 2,3
1,8 2,3 2,6 2,8
1,9 1,7 1,5 2,5





Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

Distribuimos los valores de manera ordenada en una columna. En este ejemplo
se debe tener en cuenta que como el nmero de datos es par, es necesario
entonces utilizar dos valores intermedios para as promediarlos.
1,2
1,3
1,5

1,6

1,7


1,7
1,8
1,9

1,9



2

2
2,2
2,3

2,3



2,4

2,5
2,6
2,6
2,8
2,8

Dividimos en otras cuatro partes. En esas fracciones es donde se establecen las
medianas que correspondern a los cuartiles 1, 2 y 3. El anlisis de los cuartiles
indica los valores que contienen el 25%, 50% y 75% de la informacin.
El anlisis de estos cuartiles indica:
El primer 25% de los datos reportan valores inferiores a 1.7 minutos, la mitad
logr valores por debajo o iguales a los 2 minutos, y el 75% logr tiempos hasta
2.4 minutos aproximadamente.

Tiene sentido buscar percentiles?
No, porque tenemos una muestra inferior en nmero a 100, por lo que no
habra datos suficientes para cubrir esta informacin.

(
1,7+1,7
2
) = 1,7
(
2 + 2
2
) = 2
(
2,4 + 2,5
2
) = 2,45



Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

Cmo obtenemos los cuartiles en SPSS?
Seguimos los pasos:

1. Analizar
Estadsticos Descriptivos
Frecuencias



2. En Estadsticos, activamos Cuartiles.


3.- Luego observamos el Visor de Resultados

Estadsticos
numero
N Vlidos 20
Perdido
s
0
Percentile
s
25 1,7000
50 2,0000
75 2,4500





Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

2.3. MEDIDAS DE DISPERSION

Medidas de dispersin absoluta

Las medidas de dispersin o de variabilidad miden la representatividad de las
medidas de tendencia central, obtenindose como desviacin de los valores de
la distribucin respecto a estas medidas.
Las medidas de dispersin o de variabilidad son: el recorrido, el recorrido
intercuartlico, la desviacin absoluta media respecto a la media aritmtica, la
desviacin absoluta media respecto a la mediana, la varianza y la desviacin
tpica o estndar.

Tomaremos en cuenta las siguientes medidas:

La Varianza


La Desviacin tpica o estndar


Las propiedades de la desviacin tpica son:
Es siempre mayor o igual que cero
Es una medida de dispersin ptima
Est acotada superior e inferiormente
No est afectada por cambios de origen
Si que est afectada por cambios de escala (queda multiplicada por el
factor de escala)




Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

Ejemplo
Calcular la varianza y desviacin tpica de las siguientes cantidades medidas en
metros de un conjunto de personas.

Las alturas hasta la cabeza son:

1.76 1.72 1.52 1.68 1,65










As que la altura media es 1,67 metros. En el imagen inferior lo especificamos
mediante una lnea roja.





















Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe


Ahora calculemos la diferencia de cada altura con la media:














0,11
2
+ 0,05
2
+ (-0,15)
2
+ 0,01
2
+ (-0,02)
2
0,0376 0,0094
4 4


La varianza es 0,0094
Y la desviacin estndar es la raz de la varianza:
Desviacin estndar es =0,0094 = 0,09695
La desviacin estndar es til, pues vemos que las alturas estn a distancia
menos de la desviacin estndar (0,09695 m) de la media:












As que usando la desviacin estndar tenemos una manera "estndar" de saber
qu es normal, o extra grande o extra pequeo.

= =
0,11
0,05
-0,15
0,01
-0,02
0,11
0,05
-0,15
0,01
-0,02
=0,09695
=0,09695
Elementos - 1



Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe



Cmo obtenemos la Desviacin Tpica y Varianza en SPSS?
Seguimos los pasos:

1. Analizar
Estadsticos Descriptivos
Frecuencias



2. En Estadsticos, activamos Desviacin tpica y Varianza.


3.- En el Visor de Resultados se obtiene lo siguiente:

Estadsticos
tamano
N Vlidos 5
Perdido
s
0
Desv. tp. ,09695
Varianza ,009



Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

2.4. MEDIDAS DE FORMA

Medidas de Distibucin - Asimetra y Curtosis

Las medidas de distribucin nos permiten determinar la caracterstica de cmo
los valores se muestran: agrupados o separados.
Sus principales medidas son la Asimetra y la Curtosis.

A. ASIMETRA

Esta medida nos permite identificar si los datos se distribuyen de forma uniforme
alrededor del punto central (Media aritmtica).

La asimetra presenta las siguientes formas:

Asimetra positiva, cuando la distribucin de los datos tiende a la izquierda de la
media aritmtica.
Simtrica, cuando se distribuyen aproximadamente la misma cantidad de los
datos a ambos lados de la media aritmtica.
Asimetra negativa, cuando la distribucin de los datos tiende a la derecha de la
media aritmtica.











La medida del Coeficiente de asimetra, se puede obtener mediante dos formas de
ecuaciones:


Eje de simetra
(media)
Eje de simetra
(media)
Eje de simetra
(media)
Asimetra positiva
Simtrica Asimetra negativa



Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

Coeficiente de Fisher:


Donde
Xi = cada uno de los valores.
= la media de la muestra.
ni = la frecuencia de cada valor

Coeficiente de Karl Pearson




Donde
= media aritmtica.
Md = Mediana.
s = desviacin tpica o estndar.


Los resultados de esta ecuacin se interpretan:

Si la distribucin es simtrica, ambos ndices son iguales a 0; si es asimtrica a
la derecha, ambos son positivos; y si es asimtrica a la izquierda, ambos ndices
son negativos.

B. CURTOSIS

La curtosis mide el grado de agudeza o achatamiento de una distribucin con
relacin a la regin central de la distribucin.

La curtosis presenta las siguientes formas:

Leptocrtica, cuando existe una gran concentracin.
Mesocrtica, cuando existe una concentracin normal.
Platicrtica, cuando existe una baja concentracin.




Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe











La medida del Coeficiente de asimetra, se obtiene mediante la siguiente
ecuacin:


Donde
Xi = cada uno de los valores.
= la media de la muestra.
ni = la frecuencia de cada valor.

Los resultados de esta frmula se interpretan:

Si este obtenido coeficiente es nulo, la distribucin recibe el nombre de
mesocrtica; Si el coeficiente es positivo, la distribucin se llama leptocrtica(
ms puntiaguda que la anterior); si el coeficiente es negativo, la distribucin se
llama platicrtica (ms achatada que la primera).

Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 =
0.5) y un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal.
Este criterio es de suma importancia ya que para la mayora de los
procedimientos de la estadstica de inferencia se requiere que los datos se
distribuyan normalmente.


Leptocrtica
Mesocrtica Platicrtica



Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe

Cmo obtenemos la Desviacin Tpica y Varianza en SPSS?
Seguimos los pasos:

1. Analizar
Estadsticos Descriptivos
Frecuencias


2. En Estadsticos, activamos Desviacin tpica y Varianza.




Actividad : Investigar sobre las medidas de concentracin.







Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe


AutoEvaluacin:
1. Teniendo en cuenta el tema, se puede clasificar las medidas de posicin
en :
a) ___________________________ b)________________________

2. Teniendo en cuenta lo descrito en el tema describe la desventaja de utilizar:

a) Media Aritmtica : _______________________________________
_____________________________________________________________

b) Media Geomtrica : _________________________________________
_____________________________________________________________

c) Media Armnica : _________________________________________
_____________________________________________________________

3. Qu entendemos por?:

a) Cuartil : _______________________________________
_____________________________________________________________

b) Decil : _________________________________________
_____________________________________________________________

c) Percentil : _________________________________________
_____________________________________________________________


1) Describe en pocas palabras las medidas de distribucin:

a) Medida de asimetra : _______________________________________
_____________________________________________________________
_____________________________________________________________
_____________________________________________________________
_____________________________________________________________

b) Medida de Curtosis : _________________________________________
_____________________________________________________________
_____________________________________________________________
_____________________________________________________________
_____________________________________________________________





Comuncate con nosotros.
481614 // PAC Presencial: paccis@crece.uss.edu.pe // PAC Virtual: cpead_cis@crece.uss.edu.pe


Prctica del Tema
1. Del ejemplo 1 de este tema, con respecto al tiempo obtenido por cada uno de
los participantes:
2 2,6 1,9 2
1,3 1,2 2,4 1,6
1,7 2,8 2,2 2,3
1,8 2,3 2,6 2,8
1,9 1,7 1,5 2,5
a) Determina la desviacin estndar e interpreta su resultado obtenido.
b) Determina su asimetra y curtosis que le corresponde.
2. De los siguientes datos:

a) Determine los cuartiles de las notas solo del sexo masculino. Interpreta el
resultado.

Referencias de inters sobre el Tema

Desviacin Estndar como interpretar su significado
http://www.youtube.com/watch?v=m4kimPxXzvE.

SPSS varianza y desviacin estndar muestral datos no agrupados
http://www.youtube.com/watch?v=qEFQjEmi9cg

Medidas de tendencia central
http://www.youtube.com/watch?v=-26QN9QRicg