Está en la página 1de 4

Parmetros y estadsticos

Parmetro: Es una cantidad numrica calculada sobre una


poblacin
Resume toda la informacin que hay en la poblacin en unos
pocos nmeros (parmetros).

Estadstico: Es una cantidad numrica calculada sobre una muestra


Si un estadstico se usa para aproximar un parmetro tambin se
le suele llamar estimador .

Normalmente nos interesa conocer un parmetro, pero por la


dificultad que conlleva estudiar a *TODA* la poblacin,
calculamos un estimador sobre una muestra y confiamos en que
sean prximos.

Resumen sobre estadsticos

Estadsticos de posicin

Posicin

Se define el cuantil de orden a como un valor de la variable por


debajo del cual se encuentra una frecuencia acumulada a.

Dividen un conjunto ordenado de datos en grupos con la misma


cantidad de individuos.
Cuantiles, percentiles, cuartiles , deciles,...

Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

Centralizacin
Indican valores con respecto a los que los datos parecen agruparse.
Media, mediana y moda

Dispersin
Indican la mayor o menor concentracin de los datos con respecto a las
medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza

Forma
Asimetra
Apuntamiento o curtosis

Ejemplos

Estadsticos de posicin

El 5% de los recin nacidos tiene un peso demasiado bajo.


Qu peso se considera demasiado bajo?

Percentil 5 o cuantil 0,05

Percentil de orden k = cuantil de orden k/100

Percentil 5 del peso

La mediana es el percentil 50

20
15

frecuencia

10
5

Primer cuartil = Percentil 25 = Cuantil 0,25


Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
Tercer cuartil = Percentil 75 = cuantil 0,75

Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares.

25

El percentil de orden 15 deja por debajo al 15% de las observaciones.


Por encima queda el 85%

Peso al nacer (Kg) de 100 nios

Ejemplos

Ejemplos

El colesterol se distribuye simtricamente en la poblacin. Supongamos


que se consideran patolgicos los valores extremos. El 90% de los
individuos son normales Entre qu valores se encuentran los
individuos normales?

Qu peso es superado slo por el 25% de los individuos?

Percentil 75 o tercer cuartil

Percentil 75 del peso

10

frecuencia

10

15

frecuencia

20

15

25

20

30

Percentiles 5 y 95

55

60

65

70

75

80

85

180

200

220

Peso (Kg) de 100 deportistas

0.08

20

Percentiles 25 y 75

160

170

180

190

Ejemplo

,7

Media
Mediana
Moda
Percentiles 10
20
25

6
12

,4
,8

1,1
1,9

25

1,7

3,5

8
9

68

4,5

8,0

60
70

10

56
73

3,7
4,8

11,7
16,6

75
80

11

85

5,6

22,2

12
13

461

30,6

52,8

130

8,6

61,4

14
15

175
73

11,6
4,8

73,0
77,9

16

194

12,9

90,7

17
18

43

2,9

93,6

19

45
22

3,0
1,5

96,6
98,0

20

30

2,0

100,0

1508

100,0

Total

30
40
50

20%?

densidad

0.02

M x.

45

50

55

60

65

Velocidad (Km/h) de 200 vehculos en ciudad

0.03
0.02
0.01

densidad

0.04

Diagrama de cajas de Tukey: Resumen en 5 nmeros

P25

M n .

P50

P75

80

90

100

110

120

130

140

Estadsticos de centralizacin

Estadsticos
Nmero de aos de escolarizacin
N
Vlidos
1508
Perdidos

,3

P75

Velocidad (Km/h) de 200 vehculos en autova

Nmero de aos de escolarizacin


Porcentaje
Frecuencia Porcentaje acumulado
5
,3
,3

P 50

0.00

15
10

frecuencia

5
0

Ms all de esa distancia


se consideran anmalas,
y as se marcan.

Altura (cm) en 100 varones

3
4

40

Su tamao se llama
rango intercuartlico
(IQR)

Es costumbre que los


bigotes, no lleguen hasta
los extremos, sino hasta las
observaciones que se
separan de la caja en no
ms de 1,5 IQR

P25

Mn.

0.00

Entre el cuartil 1 y 3

0.06

Resumen con 5 nmeros :


Mnimo, cuartiles y
mximo.
Suelen dar una buena
idea de la distribucin.
La zona central, caja,
contiene al 50% central de
las observaciones.

Entre qu valores se encuentran la mitad de los individuos ms


normales de una poblacin?

150

260

Diagrama de cajas de Tukey: Resumen en 5 nmeros

Diagramas de Tukey

Ejemplos

240

Colesterol en 100 personas

0.04

50

90

0
12,90
12,00
12

Son medidas que buscan posiciones (valores) con respecto a los cuales los
datos muestran tendencia a agruparse.

Media Es la media aritmtica (promedio) de los valores de una variable.


Suma de los valores dividido por el tamao muestral.
Media de 2,2,3,7 es (2+2+3+7)/4=3,5
Conveniente cuando los datos se concentran simtricamente con
respecto a ese valor. Muy sensible a valores extremos.
Centro de gravedad de los datos

Mediana Es un valor que divide a las observaciones en dos grupos con el


mismo nmero de individuos (percentil 50). Si el nmero de datos es par, se
elige la media de los dos datos centrales.
Mediana de 1,2,4,5,6,6,8 es 5
Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
Es conveniente cuando los datos son asimtricos. No es sensible a
valores extremos.

Moda Es el/los valor/es donde la distribucin de frecuencia alcanza un


mximo.

9,00
11,00
12,00
12,00
12,00
12,00
13,00
14,00
15,00
16,00
16,00

90%?

Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7!

Algunas frmulas

0.05

Miden el grado de dispersin (variabilidad) de los datos,


independientemente de su causa.

Datos organizados en tabla

si est en intervalos usar como x i las marcas de


clase. Si no ignorar la columna de intervalos.

2,1,4,3,8,4. El rango es 8-1=7


Es muy sensible a los valores extremos.

xn
x=

Media

Variable

fr. a c.

x1

n1

N1

L1 L2

x2

n2

N2

nk

Nk

Cuantil de orden a

xk

n Ni 1
( Li Li 1 )
ni

P75

Mx.

25%

25% 25%

25%

Rango intercuartlico :

Rango

Es la distancia entre primer y tercer cuartil.


Rango intercuartlico =

P75 - P25

150

160

170

180

190

Parecida al rango, pero eliminando las observaciones ms extremas


inferiores y superiores.

P5 0

Rango intercuartlico

i es el menor intervalo que tiene


frecuencia acumulada superior a a n
a=0,5 es mediana

...
Lk-1 Lk

C = Li1 +

P2 5

0.01

fr.

L0 L1

Mn.

0.02

i i

Amplitud o Rango:
Diferencia entre observacines extremas.

0.04

x=

Media

Medidas de dispersin

i xi

0.03

Datos sin agrupar: x 1, x2 , ..., xn

0.00

Varianza S2 : Mide el promedio de las desviaciones (al cuadrado) de las


observaciones con respecto a la media.

1
S = ( xi x ) 2
n i

No es tan sensible a valores extremos.

S = S2

Desviacin tpica
Es la raz cuadrada de la varianza

Tiene las misma dimensionalidad


(unidades) que la variable (Versin
esttica de la varianza).

Es sensible a valores extremos (alejados de la media).

50

40

Sus unidades son el cuadrado de las de la variable.


La expresin es fea, pero contiene la informacin geomtrica relevante en
muchas situaciones donde la energa interna de un sistema depende de la
posicin de sus partculas.

La distribucin normal o gaussiana


quedar completamente determinada por
la media y la desviacin tpica.

30

20

Energa de rotacin (va el coeficiente de inercia): patinadores con brazos extendidos


(dispersos) o recogidos (poco dispersos)

A una distancia de una S de la media hay


ms de la mitad de las observaciones.
10

Energa elstica: Muelles estirados con respecto a su posicin de equilibrio


(dispersos) frente a muelles en posicin cercana a su posicin de equilibrio (poco
dispersos)

Desv. tp. = 568,43

A una distancia de dos S de la media las


tendremos casi todas.

Media = 2023
N = 407,00

00
3.3
00
2.9
00
2.5
00
2.1
0
70
1.
00
1.3

0
90

0
50

Peso recin nacidos en partos gemelares

0.05

Coeficiente de variacin

0.04

- Es la razn entre la desviacin tpica y la media.

0.03
0.02
xs

Tambin se la denomina variabilidad o dispersin relativa.


Es frecuente mostrarla en porcentajes

0.00

95 %

0.00

160

170

180

190

S
x

x2s

68.5 %

150

CV =

Mide la desviacin tpica en forma de


qu tamao tiene con respecto a la media

0.01

0.01

0.02

0.03

0.04

0.05

Dispersin en distribuciones normales

Si la media es 80 y la desviacin tpica 20 entonces CV=20/80=0,25=25%


150

160

170

Centrado en la media y a una desv. tpica de distancia hay


aproximadamente el 68% de las observaciones.
A dos desviaciones tpicas tenemos el 95% (aprox.)

180

190

- Es una cantidad adimensional. Interesante para comparar la variabilidad


de diferentes variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan
ms dispersin en peso que en altura.

- No debe usarse cuando la variable presenta valores negativos o donde el


valor 0 sea una cantidad fijada arbitrariamente
Por ejemplo 0C 0F

Asimetra o
Sesgo

Estadsticos para detectar asimetra

Una distribucin es simtrica si la


mitad izquierda de su distribucin
es la imagen especular de su
mitad derecha.

En las distribuciones simtricas


media y mediana coinciden. Si
slo hay una moda tambin
coincide

Hay diferentes formas de caracterizar la asimetra.


Basado en diferencia entre estadsticos de tendencia central.
Basado en la diferencia entre el 1 y 2 cuartiles y 2 y 3.
Basados en desviaciones con signo al cubo con respecto a la media.
Los calculados con ordenador. Es pesado de hacer a mano.

En funcin del signo del estadstico diremos que la asimetra es


positiva o negativa .

0.5

0.15

0.4

0.10

0.3

0.05

0.2
0.1

Las discrepancias entre las


medidas de centralizacin son
indicacin de asimetra.

0.20

0.15

La media tiende a desplazarse


hacia las valores extremos (colas).

0.10

0.05

La asimetra es positiva o negativa


en funcin de a qu lado se
encuentra la cola de la
distribucin.

0.20

Distribucin simtrica asimetra nula.

xs

0.00

0.0
10

12

14

16

18

20

Distribucin simtrica :
sesgo cero
moda = mediana = media

Apuntamiento o curtosis

78 %

66%

0.00
8

La curtosis nos indica el grado de apuntamiento (aplastamiento) de una


distribucin con respecto a la distribucin normal o gaussiana. Es
adimensional.

xs

xs

78 %

-2

-1

1
x

10

12

14

Distribucin con asimetra positiva:


sesgo a la derecha: media y mediana se
encuentran a la derecha de la moda.
moda < mediana < media

Platicrtica (aplanada): curtosis < 0


Mesocrtica (como la normal): curtosis = 0
Leptocrtica (apuntada): curtosis > 0

Apuntada como la normal

Distribucin con asimetra negativa:


sesgo a la izquierda: media y mediana estn a la izquierda
de la moda.
media < mediana < moda

Apuntada

0.4
0.2

0.5

0.1

1.0

0.2

0.6

1.5

0.3

0.8

2.0

Aplanada

xs

x s

xs

68%

0.2

0.4

0.6

0.8

1.0

82 %

0.0

0.0

0.0

57 %

0.0

-3

-2

-1

-2

-1

También podría gustarte