Está en la página 1de 34

Parámetros y estadísticos

Parámetro: Es una cantidad numérica calculada sobre


una población

– La altura media de los individuos de un país


– La idea es resumir toda la información que hay en
la población en unos pocos números (parámetros).

Estadístico: Ídem (cambiar población por muestra)


– La altura media de los que estamos en este aula.
– Somos una muestra (¿representativa?) de la
población.
– Si un estadístico se usa para aproximar un
parámetro también se le suele llamar estimador.
– Normalmente nos interesa conocer un parámetro, pero por
la dificultad que conlleva estudiar a *TODA* la población,
calculamos un estimador sobre una muestra y
“confiamos” en que sean próximos. Más adelante
veremos como elegir muestras para que el error sea
“confiablemente” pequeño.
Tipos de Mediciones
MEDIA O PROMEDIO
Esta es una de las medidas de tendencia central más
usadas. Existen 3 tipos de medias: Media aritmética,
Media geométrica, Media harmónica

La media aritmética tal como se define, se puede calcular


a partir de:

a) Datos No Agrupados:
La media que se obtiene a partir de “n” datos originales Xi
se denomina MEDIA ARITMETICA SIMPLE.
n

 Xi
M ( x)  i 1
X
n
Ejemplo
En una muestra de presupuestos familiares, se ha obtenido la siguiente
información respecto al numero de hijos de 21 familias

3 2 2 2 1 1 4 1 2 1 2 3 3 3 3 0 2 3 1 3 2 3

La variable es el numero de Hijos por familias, es decir Xi= Nº


de hijos/ familia, donde los 21 valores de la variable serian X1,
X2 ... X21
21 Entonces el valor de la media
 Xi  44
i 1
N = 21 (Nº de los hijos) será:

21 Redondeando por se variable


 Xi 44
discreta, se tiene que el
numero de hijos promedio por
X  i 1
  2.095
21 21 familia es = 2
b) DATOS AGRUPADOS EN TABLAS

Los datos se pueden presentar o agrupar en tablas sin


intervalos y en tablas con intervalos , en ambos casos
se usa la Media Aritmética Pondera.
Tablas sin Intervalo (Ejemplo)
m

X n i i Nº hijos
Nº de
familias
Xi*ni
M(y)  X  i 1 Xi
Fi
n 0 1 0
m

 Xin i 44
1
2
5
7
5
14
M(y)  X  i 1
  2.095
n 21 3 7 21
Hijos por 4 1 4
familia TOTAL 21 44
TABLAS CON INTERVALOS
El calculo de la media es a partir del uso de la “marca
de clase” Yi para representar el valor de cada elemento
incluido en su respectivo intervalo.
Marca Nº de Nº de
Nº de
de herbáce cromosomas
cromosomas
clase as ponderadas m
(Y´i-1 - Y´i] Xi nI Xini X n i i
23 26 24,5 5 122,5 M(y)  X  i 1

n
26 29 27,5 40 1100
2685.00
29 32 30,5 27 823,5  29.8 crom.
32 35 33,5 11 368,5 90
35 38 36,5 3 109,5
38 41 39,5 3 118,5
41 44 42,5 1 42,5
total   90 2685
Observación:
Para un mismo conjunto de datos se
obtiene valores ligeramente diferentes
para su media; hay que tener presente
que toda agrupación de intervalos siempre
produce sesgos, y ésta es una
característica del trabajo estadístico. Los
estadígrafos no son valores exactos, pero
si son representativos de una realidad.
MEDIANA (Me)

Para un conjunto de datos ORDENADOS de mayor a


menor, la mitad de los valores serán menores o iguales a
la MEDIANA mientras que la mitad restante será
mayor o igual a la MEDIANA

50% 50%

X mín X máx
Me

La mediana divide una distribución de


frecuencia en 2 mitades
Para datos no agrupados
El ritmo cardíaco de 9 pacientes asmáticos en
estado de paro respiratorio : 167-125-120-150-
150-40-136-120-150
40-120-120-125-136-150-150-150-167

El ritmo cardíaco de 10 pacientes asmáticos en


estado de paro respiratorio : 167-150-125-120-
150-150-40-136-120-150
40-120-120-125-136-150-150-150-150-167

xn  xn 1
Me   143
2
PARA DATOS AGRUPADOS
Es aquel valor de la variable cuya frecuencia absoluta
acumulada es inmediatamente mayor a la mitad de las
observaciones
El número de hijos en 80
familias se distribuye de la
Nº de hijos ni Ni
siguiente forma:
0 5 5

1 8
2 10
N 80
3 12
  40
2 2
4 15
5 13
6 10
7 7 Me = 4 hijos
80
PARA DATOS AGRUPADOS EN
INTERVALOS

Para calcular la mediana se usa la siguiente fórmula:


N
 N i 1
Me  Li 1  2 * ai
ni
Donde:
Li-1 = Límite inferior del intervalo que contiene a la mediana
Fi-1 = Frecuencia absoluta acumulada del intervalo anterior al que
contiene a la mediana

ni = Frecuencia absoluta del intervalo que contiene a la mediana


ai = Amplitud del intervalo que contiene a la mediana
Ejemplo ...

Intervalo f F

29.5 – 34.5 8 8

34.5 – 39.5 14 22

39.5 – 44.5 20 42

44.5 – 49.5 12 54

49.5 – 54.5 4 58

N 58
 N i 1  22
Me  Li 1  2 * ai Me  39.5  2 * 5  41.25
ni 20
MODA

 Se refiere al valor de la variable que más se


repite en una distribución de frecuencia, o el
valor que está representado por el mayor
número de observaciones
 En un gráfico de barra o histograma la moda
corresponde al valor en que la distribución
alcanza el máximo
MODA PARA DATOS AGRUPADOS

Nº de hijos ni
0 5
1 8
2 10 La Moda son 4 hijos
3 12
4 15
5 13
6 10
7 7
80
Si la distribución es un histograma existe la
Intervalo (CLASE) MODAL

10
Frecuencia

150 155 160 165 170 175 180 185 190

Altura (cm)

la MODA es la marca de clase del intervalo


que contiene la mayor frecuencia
Dependiendo del número de modas que tenga la
distribución de frecuencias se hablará de una
distribución ...

 Un Máximo = Unimodal
 Dos Máximos = Bimodal
 Más de 2 máximos = Multimodal
Para calcular la moda se usa la siguiente fórmula:

ni 1
Md  Li 1  * ai
ni 1  ni 1

Donde:
Li-1 = Límite inferior del intervalo que contiene a la mediana
ni = Frecuencia absoluta del intervalo que contiene a la moda
ni+1 = Frecuencia absoluta inmediata superior
ni-1 = Frecuencia absoluta inmediata inferior

ai = Amplitud del intervalo que contiene a la mediana


A
B
Agrupando en 6 clases Agrupando en 5 clases
Intervalos Frecuencias Intervalos Frecuencias
13.5 - 16.5 2 12.5 - 16.5 2
16.5 - 19.5 9 16.5 - 20.5 13
19.5 - 22.5 13 20.5 - 24.5 16
22.5 - 25.5 9 24.5 - 28.5 11
25.5 - 28.5 9 28.5 - 32.5 1
28.5 - 31.5 1 TOTAL 43
TOTAL 43

Clase Modal = 19.5-22.5 Clase Modal = 20.5-24.5

Moda = ? Moda = ?

En el caso de frecuencias agrupadas, la


MODA varía según la forma de agrupar
DISTRIBUCIONES SIMETRICAS -
ASIMETRICAS

Si Md<Me<Y : Asmétrica Positiva


DISTRIBUCIONES SIMETRICAS -
ASIMETRICAS

Si Y<Me<Md : Asimétrica Negativa


MEDIDAS DE POSICIÓN
LOS CUANTILES
Son valores que dividen a la distribución en partes
iguales, es decir, en intervalos que comprenden el
mismo número de observaciones. Los que más se
utilizan son: los CUARTILES, DECILES Y PERCENTILES.

Los CUARTILES son 3 valores que dividen a la distribución en 4


partes iguales, cada una de las cuales contienen el 25% de las
observaciones.

Los DECILES (PERCENTILES) son 9 (99) valores que dividen a la


distribución en 10 (100) partes iguales, cada una de las cuales
contiene el 10% (1%) de las observaciones.
MEDIDAS DE POSICIÓN
LOS CUANTILES
15
0 3er cuartil
14
0
13
Mediana
0 1er cuartil
12
0
11
0
10
0
MEDIDAS DE DISPERSIÓN
RECORRIDO (RANGO)

ABSOLUTAS VARIANZA

DESVIACIÓN ESTÁNDAR

MEDIDAS DE
DISPERSIÓN

RELATIVAS COEFICIENTE DE VARIACIÓN


Recorrido (Rango)

Cuanto mayor es el recorrido mayor es la dispersión


de la distribución de la variable en estudio
Varianza

Varianza para datos no agrupados


n

 (x i  x) 2

S 2
 i 1
N
Varianza para datos agrupados
n

 (x i  x) ni
2

S 
2 i 1
N
Desviación Estándar

n
1
S 
n i 1
( xi  x) 2

Representa la variabilidad existente en un conjunto de datos, así podemos


Tener dos muestras que tienen la misma media, pero que tienen diferente
Desviación Estándar
El Coeficiente de Variación

S
CV 
x
Nos permite la comparación entre distintas variables y poblaciones.
Mide el grado de homogeneidad o heterogeneidad en una o mas poblaciones.
Su principal característica es estar desprovisto de unidades.
El valor se puede expresar en términos porcentuales
MEDIDAS DE FORMA
Asimetría o Sesgo
Una distribución es simétrica si la
mitad izquierda de su distribución
es la imagen especular de su
mitad derecha.

En las distribuciones simétricas


media y mediana coinciden. Si sólo
hay una moda también coincide

La asimetría es positiva o negativa


en función de a qué lado se
encuentra la cola de la distribución.

La media tiende a desplazarse


hacia las valores extremos (colas).

Las discrepancias entre las


medidas de centralización son
indicación de asimetría.
Coeficiente de asimetría
Apuntamiento o curtosis 160

La curtosis nos indica el grado de apuntamiento 140

(aplastamiento) de una distribución con respecto a la 120

distribución normal o gaussiana. Es adimensional.


100

Platicúrtica: curtosis < 0 80

Frecuencia
Mesocúrtica: curtosis = 0
60

40
45 48 51 54 57 60 63 66 69 72 75 78 81 84
Leptocúrtica: curtosis > 0
Platicúrtica
400 300

Los gráficos que veis poseen la 300

200
misma media y desviación
típica, pero con diferente grado 200

de apuntamiento. 100

En el curso serán de especial 100

Frecuencia
Frecuencia

interés las mesocúrticas y


simétricas (parecidas a la 0 0

normal). 3
16
27
32
37
42
47
52
57
62
67
72
77
82
87
92
97 108
102 138
27
32
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
99

Leptocúrtica Mesocúrtica
Apuntamiento

También podría gustarte