Está en la página 1de 41

lOMoARcPSD|12885708

TEMA 2 - análisis de datos GRIB apuntes

Introducción a la Estadística (ESIC University)

Studocu no está patrocinado ni avalado por ningún colegio o universidad.


Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

TEMA 2

ANÁLISIS ESTADÍSTICO DE UNA


VARIABLE

1.- MEDIDAS DE POSICIÓN

Las medidas de posición son índices diseñados


para revelar la situación de una puntuación
respecto a un grupo, utilizando éste como marco
de referencia.

1
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

FRECUENCIAS SIMPLES Y ACUMULADAS

Las frecuencias o repeticiones de una valor


pueden presentarse en una tabla estadística
como frecuencias absolutas o relativas.

Las frecuencias relativas se suelen presentar en


proporciones (tantos por 1) o en porcentajes
(tantos por 100)

FRECUENCIAS SIMPLES Y ACUMULADAS

Pedimos a una serie de personas que valoren de 0 a 10


un spot publicitario (siendo 0 la menor puntuación posible
y 10 la mayor) obteniendo los siguientes datos.

0 5 4 4
0 6 2 3
5 3 5 2
8 7 7 1
7 6 5 4
8 9 1 2
2 4 5 10

2
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

FRECUENCIAS SIMPLES Y ACUMULADAS

1º.- Lo primero que hacemos es concretar los posibles valores que puede
tomar la variable analizada (en nuestro caso la valoración del spot, y que
genéricamente se representa como Xi). Así, la primera columna de nuestra
tabla quedaría del siguiente modo:

Valoración del spot


(Xi)
0
1
2
3
4
5
6
7
8
9
10

FRECUENCIAS SIMPLES Y ACUMULADAS

2º.- Ahora calcularemos la frecuencia absoluta (representada por ni).


Simplemente se trata de contar y anotar el número de veces que aparece
cada posible valor de Xi

Valoración del spot


ni
(Xi)
0 2
1 2
2 4
3 2
4 4
5 5
6 2
7 3
8 2
9 1
10 1
TOTAL 28

3
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

FRECUENCIAS SIMPLES Y ACUMULADAS

3º.- Una vez conocida la frecuencia absoluta podemos hallar la frecuencia


absoluta acumulada (representada por Ni). Se calcula a partir de una suma
acumulada de la frecuencia absoluta. Expresa, cuando hay una relación de
orden, el número de casos que quedan por igualan o quedan por debajo de
un valor de Xi concreto.

Valoración del spot


ni Ni
(Xi)
0 2 2
1 2 4
2 4 8
3 2 10
4 4 14
5 5 19
6 2 21
7 3 24
8 2 26
9 1 27
10 1 28
TOTAL 28

FRECUENCIAS SIMPLES Y ACUMULADAS

4º.- En cuarto lugar, calculamos la frecuencia relativa simple


(representada por fi) que se calcula dividiendo la frecuencia absoluta por el
número total de personas que han valorado el spot (de elementos de la
población o muestra). La frecuencia relativa simple es la proporción (tantos
por 1) cuando la multiplicamos por 100 obtenemos el porcentaje.

Valoración del spot


ni Ni fi
(Xi)
0 2 2 0,07
1 2 4 0,07
2 4 8 0,14
3 2 10 0,07
4 4 14 0,14
5 5 19 0,18
6 2 21 0,07
7 3 24 0,11
8 2 26 0,07
9 1 27 0,04
10 1 28 0,04
TOTAL 28 1,0

4
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

FRECUENCIAS SIMPLES Y ACUMULADAS

5º.- En último lugar, calculamos la frecuencia relativa acumulada


(representada por Fi) que se calcula sumando de manera acumulada la
frecuencia relativa simple. Cuando la multiplicamos por 100 obtenemos el
porcentaje acumulado.

Valoración del spot


ni Ni fi Fi
(Xi)
0 2 2 0,07 0,07
1 2 4 0,07 0,14
2 4 8 0,14 0,29
3 2 10 0,07 0,36
4 4 14 0,14 0,50
5 5 19 0,18 0,68
6 2 21 0,07 0,75
7 3 24 0,11 0,86
8 2 26 0,07 0,93
9 1 27 0,04 0,96
10 1 28 0,04 1,00
TOTAL 28 1,0

EJERCICIO 1

Hemos pedido a un grupo de ex-clientes que no indiquen el nivel de


satisfacción experimentado con determinado producto. La escala de
valoración utilizada es de 0 a 10 (siendo 0 el menor nivel de satisfacción
posible y 10 el mayor).
5 1 2 7
2 9 5 3
0 3 8 6
6 1 5 9
5 4 9 8
4 2 8 7
3 1 3 4
2 4 4 1
2 3 1 4

Calcular una tabla de frecuencias en la que aparezcan: la frecuencia


absoluta, la frecuencia absoluta acumulada, la frecuencia relativa y la
frecuencia relativa acumulada.

10

5
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 1: SOLUCIÓN

Satisfacción (Xi) ni Ni fi Fi
0 1 1 0,03 0,03
1 5 6 0,14 0,17
2 5 11 0,14 0,31
3 5 16 0,14 0,44
4 6 22 0,17 0,61
5 4 26 0,11 0,72
6 2 28 0,06 0,78
7 2 30 0,06 0,83
8 3 33 0,08 0,92
9 3 36 0,08 1,00
10 0 36 0,00 1,00
TOTAL 36 1,0

11

Medidas de posición: CENTILES - PERCENTILES

Los centiles o percentiles son 99 valores de la variable


que dividen la distribución en 100 secciones de manera
que cada una de ellas contiene la centésima parte de las
observaciones.

Se representan con la inicial del término Centil o


Percentil más el subíndice k correspondiente.

Ck ó Pk (k=1, 2, 3, 4 … 99)

12

6
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de posición: CENTILES - PERCENTILES

“Si multiplicamos la frecuencia relativa acumulada


por 100 obtendremos los CENTILES ó
PERCENTILES” que se interpretan de la siguiente
forma:

C28 = a aquella puntuación que iguala o


deja por debajo de sí al 28% de las
observaciones y que es superada por el
72%

13

EJERCICIO 2

Indicar qué centiles les corresponden a los sujetos que han obtenido
respectivamente las puntuaciones 3 y 5 en la muestra que ha dado
lugar a la siguiente distribución de frecuencias.

Xi ni
1 10
2 80
3 50
4 30
5 20
6 10

14

7
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 2: SOLUCIÓN

Xi ni Ni fi Fi
1 10 10 0,05 0,05
2 80 90 0,40 0,45
3 50 140 0,25 0,70
4 30 170 0,15 0,85
5 20 190 0,10 0,95
6 10 200 0,05 1,00
TOTAL 200 1,00

Puntuación 3 = C70
Puntuación 5 = C95

15

Medidas de posición: DECILES

Son 9 puntuaciones que dividen la distribución en 10 partes de


manera que cada una de estas partes con tienen el 10% de las
observaciones.

Dk (k=1, 2, 3, 4, 5, 6, 7, 8, 9)

16

8
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de posición: CUARTILES

Son 3 puntuaciones que dividen la distribución en 4 partes de


manera que cada una de estas partes contienen el 25% de las
observaciones.

Qk (k=1, 2, 3)

17

CORRESPONDENCIA (Mdn, Q, D y C)

D1 C10
D2 C20
Q1 C25
D3 C30
D4 C40
Mdn Q2 D5 C50
Mediana
D6 C60
D7 C70
Q3 C75
D8 C80
D9 C90

18

9
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

2.- MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central son un tipo


de medidas de posición. Concretamente, como
su nombre indica, son medidas que representan
la posición central de una distribución de datos.

19

Medidas de tendencia central: MEDIA ARITMÉTICA

Se define como la suma de valores observados dividida


por el número de ellas.

Se representa con una letra que identifica a la variable,


escrita mayúscula y con una barra horizontal encima.

Por ejemplo si identificamos una variable como X su


media se presentará como
X

20

10
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de tendencia central: MEDIA ARITMÉTICA

La media de un conjunto de valores se calcula sumando


todos ellos y dividiendo el total entre el número de valores.

X
X i

n
ΣXi = suma de todas las
observaciones
n = número total de observaciones

21

EJERCICIO 3

Calcular la media aritmética de los siguientes grupos de


valores:

Grupo A 48 4 5 7 5 3 5 6 2 1
Grupo B 17 22 18 20 15 16 21 20 19 18 20 19
Grupo C 31 29 30 30 30 4 30 28 40 35

22

11
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 3: SOLUCIÓN

Calcular la media aritmética de los siguientes grupos de


valores:

Σ n Media
Grupo A 48 4 5 7 5 3 5 6 2 1 86 10 8,60
Grupo B 17 22 18 20 15 16 21 20 19 18 20 19 225 12 18,75
Grupo C 31 29 30 30 30 4 30 28 40 35 287 10 28,70

23

EJERCICIO 4

Xi ni
3 10
4 12
5 4
6 2
7 2

Obtener la puntuación correspondiente al centil


93 (C93)

Obtener la media de las puntuaciones Xi

24

12
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 4: SOLUCIÓN

Xi ni Ni fi Fi
3 10 10 0,33 0,33
4 12 22 0,40 0,73
5 4 26 0,13 0,87
6 2 28 0,07 0,93
7 2 30 0,07 1,00
TOTAL 30 1,00

Xi ni Xi ∙ ni
3 10 30
4 12 48
5 4 20
6 2 12
7 2 14
Σ 30 124

C93 = Puntuación 6
Media = 4,13

25

PROPIEDADES DE LA MEDIA ARITMÉTICA

Cuando comparamos la puntuación obtenida por un sujeto con la


media aritmética obtenida por el grupo al que pertenece, obtenemos
las puntuaciones diferenciales (xi).

xi  X i  X

Por ejemplo, si una persona obtiene una puntuación de 7 en una


determinada variable, y la media del grupo al que pertenece es 9. Su
puntuación diferencial será -2 (7-9=-2)

26

13
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 5

Calcular y SUMAR la puntuaciones diferenciales de los


grupos A y C de valores:

Σ n Media
Grupo A 48 4 5 7 5 3 5 6 2 1 86 10 8,60
Grupo B 17 22 18 20 15 16 21 20 19 18 20 19 225 12 18,75
Grupo C 31 29 30 30 30 4 30 28 40 35 287 10 28,70

27

EJERCICIO 5: SOLUCIÓN

Calcular y SUMAR la puntuaciones diferenciales de los


grupos A y C de valores:

Σ
Grupo A 39,4 -4,6 -3,6 -1,6 -3,6 -5,6 -3,6 -2,6 -6,6 -7,6 0
Grupo C 2,3 0,3 1,3 1,3 1,3 -24,7 1,3 -0,7 11,3 6,3 0

28

14
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

PROPIEDADES DE LA MEDIA ARITMÉTICA

Primera propiedad: la suma de las diferencias de n


puntuaciones con respecto a su media, o puntuaciones
diferenciales, es igual a 0.

x i 0

X1  5 X2  4 X3  6 X4 1 X  16 / 4  4

x1  1 x2  0 x3  2 x 4  3 x i 0

Puntuaciones diferenciales

29

PROPIEDADES DE LA MEDIA ARITMÉTICA

Segunda propiedad: la suma de los cuadrados de las


desviaciones de unas puntuaciones con respecto a su
media es menor que con respecto a cualquier otro valor.

 (X i  X )2   (X i  c)2

siendo c  X

(X i  X ) 2  (5  4) 2  (4  4) 2  (6  4) 2  (1  4) 2  14

(X i  6) 2  (5  6) 2  (4  6) 2  (6  6) 2  (1  6) 2  30

30

15
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

PROPIEDADES DE LA MEDIA ARITMÉTICA

Tercera propiedad: si sumamos una constante a un


conjunto de puntuaciones, la media aritmética quedará
aumentada en esa misma constante.
Si Yi  X i  k
entonces Y  X k

Si sumamos 3 a los valores que estamos utilizando en el ejemplo tenemos que:

(5  3)  (4  3)  (6  3)  (1  3) 28
 7
4 4

Y  X 3 43 7

31

PROPIEDADES DE LA MEDIA ARITMÉTICA

Cuarta propiedad: si multiplicamos por una constante a


un conjunto de puntuaciones, la media aritmética quedará
multiplicada por esa misma constante.

Si Yi  X i  k
entonces Y  X k

Si multiplicamos por 3 los valores que estamos utilizando en el ejemplo tenemos que:

(5  3)  (4  3)  (6  3)  (1  3) 48
  12
4 4

Y  X  3  4  3  12

32

16
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

PROPIEDADES DE LA MEDIA ARITMÉTICA

Quinta propiedad: la media de un grupo de puntuaciones, cuando se


conocen los tamaños y medias de varios subgrupos hechos a partir del
grupo total (mutuamente exclusivos y exhaustivos) puede obtenerse
ponderando las medias parciales a partir de los tamaños de los
subgrupos en que han sido calculadas.

n1  X 1  n2  X 2  ...  nk  X k
XT 
n1  n2  ...  nk

Si disponemos ahora de otro conjunto de 3 valores, 6, 8 y 1 (media=5), la


media de las 7 puntuaciones será:

(4  4  3  5)
(5  4  6  1  6  8  1) XT   4,43
 4,43 43
7

33

EJERCICIO 5

Hemos pasado un cuestionario para medir la actitud hacia las


marcas a un grupo de 16 jubilados, un grupo de 12 personas
mayores de 35 años, y a 14 universitarios.
El primer grupo ha obtenido una puntuación media de 5, el
segundo de 12 y el tercero de 22.

Calcula la puntuación media considerando a los tres grupos


conjuntamente.

34

17
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 5: SOLUCIÓN

n1  X 1  n 2  X 2  ...  n k  X k
XT 
n1  n 2  ...  n k

(16  5  12  12  14  22 ) 532
XT    12 ,7
16  12  14 42

35

PROPIEDADES DE LA MEDIA ARITMÉTICA

Sexta propiedad: una variable definida como la


combinación lineal de otras variables tiene como media
la misma combinación lineal de las medias de las
variables intervinientes en su definición.

Si Ti  a  Vi  b  X i  ...  k  Z i
entonces T  a  V  b  X  ...  k  Z

36

18
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 6

Corregido el examen de matemáticas de 20 alumnos se


obtienen las siguientes puntuaciones:

2, 6, 2, 5, 2, 4, 2, 2, 3, 4, 3, 6, 3, 3, 5, 3, 4, 3, 3, 4

1.- Calcula la distribución de frecuencias (columnas Xi y ni).


2.- Calcula e interpreta los centiles 25 y 80.
3.- Suma las 20 puntuaciones.
4.- Calcula la media a partir de la suma anterior y a partir de
la distribución de frecuencias calculada en el apartado 1.

37

EJERCICIO 6: SOLUCIÓN

Xi ni Ni fi Fi
2 5 5 0,25 0,25
3 7 12 0,35 0,60
4 4 16 0,20 0,80
5 2 18 0,10 0,90
6 2 20 0,10 1,00
TOTAL 20 1,00

Xi ni Xi ∙ ni
2 5 10
C25 = El 25% de los alumnos
3 7 21
obtiene una nota de 2 4 4 16
5 2 10
C80= El 80% de los alumnos 6 2 12
obtiene una nota de 4 a inferior Σ 20 69

Media 69/20 3,45

38

19
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 7

Tenemos un autobús de la EMT en el que viajan 30


jubilados con una media de 20 euros en el bolsillo, 20
escolares con una media de 5 euros, y el conductor del
autobús que tiene 42 euros.

¿Podrías calcular la media de euros que llevan en el


bolsillo considerando todos los subgrupos como uno?

39

EJERCICIO 7: SOLUCIÓN

n1  X 1  n 2  X 2  ...  n k  X k
XT 
n1  n 2  ...  n k

(30  20  20  5  1  42 ) 742
XT    14 ,5
30  20  1 51

40

20
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de tendencia central: MEDIANA

La mediana (Mdn) indica aquella puntuación que divide


el conjunto de valores en dos mitades iguales.

Para calcularla simplemente obtendremos el valor C50


de la distribución de las observaciones.

Aunque también podemos aplicar el siguiente


procedimiento:

41

Medidas de tendencia central: MEDIANA

Cuando tengamos un número impar de valores utilizaremos la


siguiente fórmula: (n+1)/2 (donde n es el número de
observaciones).
Ejemplo: tenemos un conjunto de valores. 7, 11, 6, 5, 7, 12, 9,
8, 10, 6, 9
Primero ordenamos los valores de menor a mayor:
5, 6, 6, 7, 7, 8, 9, 9, 10, 11, 12
Ahora calculamos (n+1)/2= (11+1)/2= 6
Por tanto la mediana el valor situado en la posición 6ª
5, 6, 6, 7, 7, 8, 9, 9, 10, 11, 12

42

21
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de tendencia central: MEDIANA

Cuando tengamos un número par de valores calcularemos del siguiente


modo:

Tenemos un conjunto de valores. 23, 35, 43, 29, 34, 41, 33, 38, 38, 32

Primero ordenamos los valores de menor a mayor:

23, 29, 32, 33, 34, 35, 38, 38, 41, 43

Como tenemos un número par de valores (10) el puntuación que dividiría


en dos parte iguales la distribución estaría situada en la posición 5,5ª (es
decir, entre la posición 5ª y 6ª). Simplemente calcularemos la media
aritmética de estas dos puntuaciones:

23, 29, 32, 33, 34, 35, 38, 38, 41, 43

Mdn= (34+35)/2=34,5

43

EJERCICIO 8

Calcular la mediana de los siguientes grupos de


puntuaciones.

Grupo A: 24, 8, 13, 9, 18, 10, 12, 10 ,14 ,18

Grupo B: 5, 23, 15, 25, 18, 24, 5

44

22
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 8: SOLUCIÓN

Grupo A
8
9 Grupo B
10 5
10 5
12 15
13
Mdn= (12+13)/2=12,5 18 Mdn=18
14 23
18 24
18 25
24

45

Medidas de tendencia central: MODA

La moda, que se representa por Mo, define el valor de la


variables con mayor frecuencia. Es decir, el valor que más se
repite.
8, 8, 11, 11, 11, 15, 15, 15, 15, 15, 17, 17, 17 ,19, 19
El valor 15 se repite más veces. Mo = 15
8, 8, 8, 11, 11, 11, 15, 15, 15, 17, 17, 17, 19, 19, 19
Todos los valores con la misma frecuencia. Distribución amodal.
8, 9, 9, 10, 10, 10, 10, 11, 11, 13, 13, 13, 13, 15, 15
Podemos encontrar una distribución bimodal, en la que hay dos
valores con la misma frecuencia máxima (en este caso 10 y 13).

46

23
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

CRITERIOS DE ELECCIÓN DE LA MEDIDA DE


TENDENCIA CENTRAL

1. Si no hay argumento de peso en contra, utilizaremos siempre


la media.

2. Utilizaremos la mediana y no la media cuando


• Cuando la variable esté medida en escala ordinal
• Cuando haya valores extremos que puedan distorsionar la media

3. Utilizaremos la moda cuando:


• Cuando la variable esté medida en escala nominal
• Cuando haya intervalos abiertos y la mediana pertenezca a uno de
ellos

47

EJERCICIO 9

La siguiente tabla ofrece los resultados de “un mismo


colectivo de personas” en tres variables. Calcula los
datos que faltan en el siguiente tabla.

X ΣXi n
Variable 1 40 ? 20
Variable 2 ? 100 ?
Variable 3 10 ? ?

48

24
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 9: SOLUCIÓN

Como tenemos “un mismo colectivo de personas”


sabemos que “n” siempre vale lo mismo (en este caso
20). A partir de ahí utilizamos la fórmula de la media
aritmética para despejar y calcular lo que necesitemos.

X ΣXi n
Variable 1 40 800 20
Variable 2 5 100 20
Variable 3 10 200 20

49

3.- MEDIDAS DE VARIACIÓN (DISPERSIÓN)

Cuando utilizamos las medidas de tendencia central


obtenemos un dato que “resume” el conjunto de
puntuaciones observado.

Al objeto de complementar la información obtenida a


partir de este tipo de medidas deberemos considerar
otros indicadores que nos aporten más información
sobre los datos.

Por eso vamos a estudiar la forma de calcular la


propiedad de los datos que hace referencia a la
variabilidad.

50

25
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

MEDIDAS DE VARIACIÓN

Observemos los siguientes datos:

Grupo A: 4, 10, 12, 14, 20


En ambos casos la media es igual a 12…
Grupo B: 10, 11, 12, 13, 14

… pero en los datos del grupo A hay dos valores (4 y 20) que se alejan
mucho del valor promediado. Y por eso diremos que la media
representa mejor los datos del grupo B.

Podríamos pensar en calcular el promedio de las puntuaciones


diferenciales y utilizarlo como indicador de la variabilidad.

51

MEDIDAS DE VARIACIÓN

Grupo A: 4, 10, 12, 14, 20


Grupo B: 10, 11, 12, 13, 14 En ambos casos la media es igual a 12…

… entonces tendríamos las siguientes puntuaciones diferenciales:

Grupo A: -8, -2, 0, 2, 8


Grupo B: -2, -1, 0, 1, 2

… pero sabemos que la suma de las puntuación diferenciales siempre


es 0 y por tanto no podemos calcular la media de las puntuaciones
diferenciales.

52

26
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de variación: VARIANZA

Para salvar esta situación vamos a elevar las


puntuaciones diferenciales al cuadrado.

Siguiendo esta estrategia obtenemos un indicador de


la variabilidad que recibe el nombre de varianza, y que
se representa como S 2
x

53

Medidas de variación: VARIANZA

Podemos calcular la varianza (definida como el


promedio de las desviaciones cuadráticas con respecto
a la media) haciendo uso de las siguientes fórmulas.

(X X
2
2 i  X )2 2 i
S x  S x  X2
n n

Si tenemos calculadas las puntuaciones


S 2

x i
2

diferenciales (x minúscula) podemos usar x


n

54

27
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de variación: VARIANZA

Vamos a calcular la varianza teniendo en cuenta los


siguientes grupos de datos:

Grupo A: 4, 10, 12, 14, 20


Grupo B: 10, 11, 12, 13, 14

Para ello haremos uso de la siguiente fórmula:

S 2

 (X i  X )2
x
n

55

Medidas de variación: VARIANZA

Grupo A: 4, 10, 12, 14, 20


S x2 
(X i  X )2
n

GRUPO A Xi Xi  X (X i  X )2
4 -8 64
10 -2 4
12 0 0
14 2 4
20 8 64
Σ 60 0 136
n 5
Media 12
Varianza 136/5 27,2

56

28
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de variación: VARIANZA

Grupo B: 10, 11, 12, 13, 14


S x2 
(X i  X )2
n

GRUPO B Xi Xi  X ( X i  X )2
10 -2 4
11 -1 1
12 0 0
13 1 1
14 2 4
Σ 60 0 10
n 5
Media 12
Varianza 10/5 2

57

EJERCICIO 10

Calcular la varianza de las siguientes puntuaciones:

5, 8, 12, 10, 15

Utiliza la siguiente fórmula

S 2

 (X i  X )2
x
n

58

29
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 10: SOLUCIÓN

Puntuaciones: 5, 8, 12, 10, 15 S x2 


(X i  X )2
n

Xi Xi  X ( X i  X )2
5 -5 25
8 -2 4
12 2 4
10 0 0
15 5 25
Σ 50 0 58
n 5
Media 10
Varianza 58/5 11,6

59

PROPIEDADES DE LA VARIANZA

Primera propiedad: tanto la varianza como la desviación


típica (que veremos más adelante) son valores
esencialmente positivos:

S x2  0 Sx  0

60

30
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

PROPIEDADES DE LA VARIANZA

Segunda propiedad: si sumamos una constante a un


conjunto de puntuaciones, su varianza no se altera.

Si Yi  X i  k
entonces S Y2  S X2

61

PROPIEDADES DE LA VARIANZA

Si sumamos una constante 3 a las puntuaciones 5, 8, 10, 13 (cuya


varianza es 8,5), la varianza de las nuevas puntuaciones sigue siendo
8,5.

La nuevas puntuaciones son 8, 11, 13, 16 (y su media 12)…

(8  12 ) 2  (11  12 ) 2  (13  12 ) 2  (16  12 ) 2 34


S y2    8,5
4 4

62

31
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

PROPIEDADES DE LA VARIANZA

Tercera propiedad: si multiplicamos por una constante un


conjunto de puntuaciones, la varianza quedará multiplicada
por el cuadrado de la constante y la desviación típica por el
valor absoluto de esa constante.

Si Yi  X i  k
entonces S Y2  k 2  S X2 y SY  k  S X

63

PROPIEDADES DE LA VARIANZA

Si multiplicamos las puntuaciones 5, 8, 10, 13 (cuya varianza es 8,5)


por la constante 2, la varianza de las nuevas puntuaciones es igual a la
de las puntuaciones originales multiplicada por el cuadrado de la
constante (22=4 entonces 8,5*4=34).

La nuevas puntuaciones son 10, 16, 20, 26 (y su media 18)…

(10  18 ) 2  (16  18 ) 2  ( 20  18 ) 2  ( 26  18 ) 2 136


S y2    34
4 4

64

32
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de variación: VARIANZA

Vista de manera asilada la varianza es difícil de interpretar.


¿El valor de 27,2 que hemos obtenido a partir de las
puntuaciones del Grupo A, es alto, medio o bajo?

Como hemos elevado las puntuaciones diferenciales al


cuadrado, los valores que obtenemos parecen no estar
relacionados con el conjunto de datos que estamos
analizando.

Grupo A: 4, 10, 12, 14, 20 Varianza=27,2

65

Medidas de variación: VARIANZA

Además, debemos tener en cuenta que “no tiene


sentido comparar la varianza halladas a partir de dos
variables distintas” (por ejemplo edad e ingresos).

La varianza es útil cuando se comparan dos


conjuntos de valores de una misma variable (por
ejemplo, variabilidad entre la altura de hombres y
mujeres).

66

33
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de variación: DESVIACIÓN TÍPICA

Al objeto de recuperar las unidades originales de las


distancias de las puntuaciones respecto a su media,
simplemente tenemos que calcular la raíz cuadrada de
la varianza obtenida.

Llamaremos a este nuevo índice desviación típica y la


representaremos como S x

67

Medidas de variación: DESVIACIÓN TÍPICA

Para calcular la desviación típica podemos hacer uso de la


siguiente fórmula:

Sx 
 (X i  X )2
n

La desviación típica equivale al promedio de las puntuaciones


diferenciales (que antes no podíamos calcular porque
sumaban 0).

Grupo A: 4, 10, 12, 14, 20


Grupo B: 10, 11, 12, 13, 14

68

34
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

Medidas de variación: DESVIACIÓN TÍPICA

Por los cálculos anteriores sabemos que:

Grupo A: 4, 10, 12, 14, 20 Varianza= 27,2


Grupo B: 10, 11, 12, 13, 14 Varianza= 2

SA  27 , 2  5, 2

SB  2  1,4

69

Medidas de variación: DESVIACIÓN TÍPICA

La desviación típica es el mejor descriptor de la


variabilidad aunque la varianza, debido a sus
propiedades matemáticas, es idónea para realizar
análisis estadísticos complejos.

En ciencias sociales, detrás de la variabilidad


encontramos diferencias entre personas. El análisis y
la comprensión de estas diferencias permite encontrar
“regularidades” y construir o contrastar teorías y
modelos.

70

35
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 11

Calcular la desviación típica del siguiente grupo de


puntuaciones:

20, 24, 22 ,28, 20

71

EJERCICIO 11: SOLUCIÓN

Xi Xi  X (X i  X )2
20 -2,8 7,8
24 1,2 1,4
22 -0,8 0,6
28 5,2 27,0
20 -2,8 7,8
Σ 114 0,00 45
n 5
Media 22,8
Varianza 9,0 Desv. Tipica 3,0

72

36
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

EJERCICIO 12

Con el fin de evitar números decimales los datos de


una variable (X) fueron multiplicados por 10,
resultando una varianza de 250. Calcula la varianza
de las puntuaciones originales.

73

EJERCICIO 12: SOLUCIÓN

Con el fin de evitar números decimales los datos de una variable (X) fueron
multiplicados por 10, resultando una varianza de 250. Calcula la varianza
de las puntuaciones originales.

S Y2  k 2  S X2
250  10 2  S X2
250
S X2   2 .5
100

74

37
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

4.- MEDIDAS ASIMETRÍA Y CURTOSIS

Los estadísticos asociados a la asimetría y a la


curtosis nos aportan información
complementaria sobre la distribución de
frecuencias.

Para el análisis de este tipo de medidas


partiremos de la representación gráfica de los
datos.

75

ASIMETRÍA

Una distribución es simétrica cuando presenta la siguiente


forma:
7

0
1 2 3 4 5 6 7 8 9 10 11

En este caso la media, la moda y la mediana coinciden en el


mismo punto.

76

38
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

ASIMETRÍA

Una distribución es asimétrica positiva o cola a la derecha


cuando presenta la siguiente forma:

0
1 2 3 4 5 6 7 8 9 10 11

77

ASIMETRÍA

Una distribución es asimétrica negativa o cola a la izquierda


cuando presenta la siguiente forma:

0
1 2 3 4 5 6 7 8 9 10 11

78

39
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)
lOMoARcPSD|12885708

ASIMETRÍA

Como indicador de la asimetría podemos usar el coeficiente


de asimetría de Pearson que calcularemos con la siguiente
fórmula:
̅−
=

Índice = 0 = simetría
Índice > 0 =asimetría positiva (cola a la derecha)
Índice < 0 =asimetría negativa (cola a la izquierda)

79

CURTOSIS O APUNTAMIENTO

El grado de apuntamiento de una distribución de frecuencias cuando


se compara con una “distribución normal” (forma de campana
simétrica) se denomina curtosis.
Para calcular este índice normalmente se recurre al segundo
coeficiente de Fisher (g2) y podemos distinguir entre:
Distribución mesocúrtica cuando el índice es igual a 0
Distribución leptocúrtica cuando el índice es positivo
Distribución platicúrtica cuando el índice es negativo

80

40
Descargado por Valeria Fuentes (valeriafr2003@gmail.com)

También podría gustarte