Está en la página 1de 12

Parmetros y estadsticos

Parmetro: Es una cantidad numrica calculada sobre una


poblacin y resume los valores que esta toma en algn atributo
Intenta resumir toda la informacin que hay en la poblacin en unos pocos
nmeros (parmetros). La altura media de los sujetos

Estadstico: Es una cantidad numrica calculada sobre una


muestra que resume su informacin sobre algn aspecto
Si un estadstico se usa para aproximar un parmetro tambin se le suele
llamar estimador
Normalmente nos interesa conocer un parmetro, pero por la dificultad que
conlleva estudiar a *TODA* la poblacin, calculamos un estimador sobre
una muestra y confiamos en que sean prximos.

Tipos de estadsticos
Posicin
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Entre ellos cabe destacar: Cuantiles, percentiles, cuartiles, deciles,...

Centralizacin
Indican valores con respecto a los que los datos parecen agruparse.
Entre ellos cabe destacar: Media, mediana y moda

Dispersin
Indican la mayor o menor concentracin de los datos con respecto a
las medidas de centralizacin.
Entre ellos : Desviacin tpica, coeficiente de variacin, rango, varianza

Forma
Dan una idea de cmo se distribuyen los datos
Entre ellos: Asimetra, Apuntamiento o curtosis

Estadsticos de posicin
Se define el cuantil de orden a como un valor de la variable por
debajo del cual se encuentra una frecuencia acumulada a.
Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

Percentiles y cuantiles
Percentil de orden k = cuantil de orden k/100
.
La mediana se corresponde con el percentil 50
El percentil de orden 15 deja por debajo al 15% de las observaciones.
Por encima queda el 85%

Cuartiles: Dividen a la muestra en 4 grupos con frecuencias


similares.
Primer cuartil = Percentil 25 = Cuantil 0,25
Segundo cuartil = Percentil 50 = Cuantil 0,5= mediana
Tercer cuartil = Percentil 75 = Cuantil 0,75

Ejemplos
El 5% de los recin nacidos tiene un peso demasiado bajo. Qu
peso se considera demasiado bajo?
Percentil 5 o cuantil 0,05

Qu peso es superado slo por el 25% de los individuos?


Percentil 75 o cuantil 0,75

El colesterol se distribuye simtricamente en la poblacin. Se


considera patolgico los valores extremos. El 90% de los individuos
son normales Entre qu valores se encuentran los individuos
normales?
Entre el percentil 5 y el 95

Qu peso no llega a alcanzar el 25%


de los individuos?
Primer cuartil = Percentil 25= 60 Kg

Qu peso es superado por el 25% de


los individuos?
Tercer cuartil = Percentil 75 = 80 Kg

Entre qu valores se encuentra el


50% de los individuos con un peso
ms normal?
Entre el primer y tercer cuartil = entre
60 y 80 kg.
Este intervalo coincide con los individuos
que ocupan la parte central de la muestra.
Los diagramas de caja sintetizan esta
informacin.
Estadsticos
PESO
Percentiles

25
50
75

3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total

Porcentaje
,3
,3
,4
,8
1,7
4,5
3,7
4,8
5,6
30,6
8,6
11,6
4,8
12,9
2,9
3,0
1,5
2,0
100,0

80

70

50

40

Estadsticos

Nmero de aos de escolarizacin


Frecuencia
5
5
6
12
25
68
56
73
85
461
130
175
73
194
43
45
22
30
1508

90

60

60,00
70,00
80,00

Ejemplos

100

Porcentaje
acumulado
,3
,7
1,1
1,9
3,5
8,0
11,7
16,6
22,2
52,8
61,4
73,0
77,9
90,7
93,6
96,6
98,0
100,0

20%?

Nmero de aos de escolarizacin


N
Vlidos
1508
Perdidos
0
Media
12,90
Mediana
12,00
Moda
12
Percentiles
10
9,00
20
11,00
25
12,00
30
12,00
40
12,00
50
12,00
60
13,00
70
14,00
75
15,00
80
16,00
90
16,00

90%?

Medidas de centralizacin
Media (Mean) Es la media aritmtica (promedio) de los valores
de una variable. Suma de los valores dividido por el tamao
muestral.
La media es un promedio aritmtico: de 2,2,3,7 es (2+2+3+7)/4=3,5

Conveniente cuando los datos se concentran simtricamente con


respecto a ese valor. Muy sensible a valores extremos.
Se puede considerar como el centro de gravedad de los datos

Mediana (median) Es un valor que divide a las observaciones


en dos grupos con el mismo nmero de individuos (percentil 50). Si
el nmero de datos es par, se elige la media de los dos datos
centrales.
Mediana de 1,2,4,5,6,6,8 es 5
Es conveniente cuando los datos son asimtricos. No es sensible a
valores extremos.
Ejemplo: Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7!

Moda (mode) Es el/los valor/es donde la distribucin de


frecuencia alcanza su mximo.

Las formulas
Media (Para datos sin agrupar: x1, x2, ..., xn )
x=

x
i

n
Media (Para agrupados u organizados en tablas)
Variable

fr.

fr. ac.

L0 L1

x1

n1

N1

L1 L2

x2

n2

N2

xk

nk

Nk

...
Lk-1 Lk

x=

xn = N
i

i i

Cuartil de orden (Para agrupados u organizados en tablas)


Siendo i es el menor intervalo que tiene frecuencia acumulada
superior a n
n N i 1
C = Li 1 +
( Li Li 1 )
ni

Altura mediana

Ejemplo con variables agrupadas


La media, en teste caso, se desplaza hacia los valores extremos. No
coincide con la mediana. Es un punto donde el histograma estara
en equilibrio si tuviese masa.
N

40 50

45

50 60

55

10

15

60 70

65

21

36

70 - 80

75

11

47

80 - 90

85

52

90 - 100

95

55

100 130

115

58

Peso

Total

Marca

58

Para calcular la media


es necesario elegir un
punto representante
del intervalo: La
marca de clase.

C = Li 1 +

Peso

n N i 1
ni
Marca

0,5 58 Ni 1
( Li Li 1 )
ni
)
0,5 58 15
(70 60) = 66,6
= 60 +
21

( Li Li 1 ) Mediana = C0,5 = Li 1 +

40 50

45

50 60

55

10

15

60 70

65

21

36

70 - 80

75

11

47

80 - 90

85

52

90 - 100

95

55

100 130

115

58

58

C0,5 = 60 +

)
0,5 58 15
(70 60) = 66,6
21

Variabilidad o Dispersin
La variabilidad de en los valores de un cualquier atributo que
evaluemos est presente siempre en la naturaleza y en cualquier
fenmeno social, su origen en ciencias sociales, es siempre mltiple.
EJEMPLO: Los estudiantes de Sociologa reciben diferentes
calificaciones en la asignatura (variabilidad). A qu puede deberse?
Diferencias individuales en el conocimiento de la materia.
Podra haber otras razones (fuentes de variabilidad)? . Supongamos
que todos los alumnos poseen el mismo nivel de conocimiento. Las
notas seran las mismas en todos? Seguramente No.
Dormir poco el da del examen, el croissant estaba envenenado...
Diferencias individuales en la habilidad para hacer un examen.
El examen no es una medida perfecta del conocimiento.
Variabilidad por error de medida.
En alguna pregunta difcil, se duda entre varias opciones, y al
azar se elige la mala.
Variabilidad por azar, aleatoriedad.

Medidas de Dispersin
Miden el grado de dispersin (variabilidad) de los datos,
independientemente de su causa.
Amplitud o Rango (range):
Es la diferencia entre las observacines
extremas.
Es muy sensible a valores extremos.
EJEMPLO: 2,1,4,3,8,4.
El rango es 8-1=7.

Rango intercuartlico
(interquartile range):
Es la distancia entre el primer y tercer
cuartil.

25%

25%

25%

Parecida al rango, pero elimina las


observaciones ms extremas inferiores y
superiores, hacindose menos sensible a
valores extremos.
Rango intercuartlico = P75 - P25

Variabilidad o Dispersin
Varianza S2 (Variance): Mide el promedio de las desviaciones
(al cuadrado) de las observaciones con respecto a la media.

S2 =

1
( xi x ) 2

n i

Es sensible a valores extremos (alejados de la media).


Sus unidades son el cuadrado de las de la variable.
El llamado coeficiente de inercia (mayor o menor dispersin de
los valores) influye en sus valores. Como la razn fsica de porqu
un patinador gira a diferente velocidad cuando extiende o recoge sus
brazos

Por estos inconvenientes se utiliza la Desviacin tpica

Desviacin tpica
Desviacin tpica (standard deviation). Es la raz cuadrada de la
varianza
x 2
x + 2

S = S2

x +

50

Tiene las misma dimensionalidad


(unidades) que la variable. La
distribucin (normal o gaussiana)
viene determinada por la media y
la desviacin tpica.

40

30

20

A una distancia de una desv. tpica


de la media tendremos 68%
observaciones.

Desv. tp. = 568,43


Media = 2023
N = 407,00

3.

2.

2.

2.

1.

1.

30

90

50

10

70

30

50

90

A una distancia de dos desv. tpica


de la media tendremos 95%
observaciones.

10

Peso recin nacidos en partos gemelares

Centrado en la media y a una


desviacin tpica de distancia
tenemos ms de la mitad de las
observaciones

A dos desviaciones tpicas las


tenemos a casi todas

Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.
Mide la desviacin tpica en forma de qu tamao tiene con
respecto a la media o desviacin por unidad de media

CV =

S
x

Tambin se la denomina Variabilidad relativa


Es frecuente mostrarla en porcentajes.
EJEMPLO: Si la media es 80 y la desviacin tpica 20 entonces
CV=20/80=0,25=25% (variabilidad relativa)
Es una cantidad adimensional. Interesante para comparar la
variabilidad de diferentes variables.
EJEMPLO: Si el peso tiene CV=30% y la altura tiene CV=10%, los
individuos presentan ms dispersin en peso que en altura.
No debe usarse cuando la variable presenta valores negativos o
donde el valor 0 sea una cantidad fijada arbitrariamente

Asimetra o sesgo
Una distribucin es simtrica
si la mitad izquierda de su
distribucin es la imagen
especular de su mitad
derecha.
En las distribuciones
simtricas media y mediana
coinciden. Si slo hay una
moda tambin coincide
La asimetra es positiva o
negativa en funcin de a qu
lado se encuentra la cola de la
distribucin
La media tiende a desplazarse
hacia las valores extremos
(colas). Discrepancias entre
las medidas de centralizacin
indican la asimetra.

10

Estadsticos de Asimetra
Basados en diferencia entre estadsticos de tendencia central, se utilizan:
Por diferencias intercuartlicas 1 y 2 cuartiles y 2 y 3.

Basados en desviaciones con signo respecto a la media. En este se


basa SPSS.
En funcin del signo del estadstico diremos que la asimetra es
positiva o negativa. Distribucin simtrica la que tiene asimetra nula.

Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribucin con respecto a la distribucin normal o gaussiana, que es
adimensional.
Las series que representan los siguientes grficos poseen la misma
media y desviacin tpica, pero con diferente grado de apuntamiento.
400

160

300

140

300
200

120

200

100

100

60

100

Frecuencia

Frecuencia

Frecuencia

80

0
3

40
45 48 51 54 57 60 63 66 69 72 75 78 81 84

Platicrtica

27
16

37
32

47
42

Leptocrtica

57
52

67
62

77
72

87
82

97
92

108

102

138

0
27

37
32

45
41

53
49

61
57

69
65

77
73

85
81

93
89

99

Mesocrtica

Se denomina:
Platicrtica: curtosis < 0

Mesocrtica: curtosis = 0
Leptocrtica: curtosis > 0

11

Salida de Estadsticos del SPSS


El SPSS nos permite sacar todos estos estadsticos en una sola orden:
En el men Analizar Estadsticos descriptivos Descriptivos
y con todas las opciones activas nos muestra la tabla siguiente:
Descriptivos para Nmero de hijos
Media
Intervalo de
confianza para la
media al 95%

Estadstico
1,90
Lmite
inferior
Lmite
superior

Error tp.
,045

1,81
1,99

Los diagramas de caja


resumen gran parte de
esta informacin

Media recortada al 5%
1,75
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil

2,00
3,114
1,765
0
8
8
3,00

Asimetra
Curtosis

1,034
1,060

,063
,126

12

También podría gustarte