Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 2: Estadísticos
1
Estadística descriptiva y estadística inferencial
2
Parámetros y estadísticos
3
Parámetros y estadísticos
Estadístico:: Es una cantidad numérica calculada sobre una muestra.
Es un valor numérico que describe una característica de una
población.
Más adelante veremos como elegir muestras para que el error sea
“confiablemente” pequeño”.
4
5
Ejercicio. Para cada uno de los siguientes estudios:
Identificar la población objeto de estudio en cada caso y diferenciar
si se ha optado por trabajar con una muestra de esa población o con
la población.
Identificar si el estudio sería descriptivo, o bien, inferencial.
6
Un psicólogo de servicios sociales de un ayuntamiento quiere
conocer la actitud hacia la inmigración de los habitantes de un barrio
conflictivo de la ciudad. Para ello realiza una encuesta telefónica a
100 personas censadas en dicho barrio.
7
Un brevísimo resumen sobre estadísticos
Posición
Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles,...
Centralización
Indican valores con respecto a los que los datos parecen
agruparse.
Media, mediana y moda
Dispersión
Indican la mayor o menor concentración de los datos
con respecto a las medidas de centralización.
Desviación típica, coeficiente de variación, rango, varianza
Forma
Asimetría
Apuntamiento o curtosis
8
9
Estadísticos de posición
10
Estadísticos de posición
11
Ejemplos
El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué
peso se considera “demasiado bajo”?
Percentil 5 o cuantil 0,05
Percentil 5 del peso
25
20
frecuencia
15
10
5
0
1 2 3 4 5
12
Ejemplos
¿Qué peso es superado sólo por el 25% de los individuos?
Percentil 75 o tercer cuartil
15
10
5
0
50 55 60 65 70 75 80 85
10
5
0
10
5
0
16
Estadísticos de centralización
Añaden unos cuantos casos particulares a las medidas de posición. En este caso
son medidas que buscan posiciones (valores) con respecto a los cuales los
datos muestran tendencia a agruparse.
18
Algunas fórmulas
Datos sin agrupar: x1, x2, ..., xn
Media
x
x i i
n
Datos organizados en tabla
si está en intervalos usar como xi las marcas de
clase. Si no ignorar la columna de intervalos.
Media x
xn i i i
n
Variable fr. fr. ac.
Cuantil de orden α
L0 – L1 x1 n1 N1
i es el menor intervalo que tiene
L1 – L2 x2 n2 N2 frecuencia acumulada superior a α ·n
... α=0,5 es mediana
a n N i 1
Lk-1 – Lk xk nk Nk Ca Li 1 ( Li Li 1 )
n ni
19
Ejemplo con variable en intervalos
20
Ejemplo (continuación)
Peso M. Clase Fr. Fr. ac.
40 – 50 45 5 5
x
xn i i i
45 5 55 10 115 3
69,3
50 – 60 55 10 15 n 58
60 – 70 65 21 36
70 - 80 75 11 47 0,5 58 N i 1
Mediana C0,5 Li 1 ( Li Li 1 )
80 - 90 85 5 52 ni
90 - 100 95 3 55 0,5 58 15
100 – 130 115 3 58
60 (70 60) 66,6
21
58
0,75 58 N i 1 43,5 36
P75 C0,75 Li 1 ( Li Li 1 ) 70 (80 70) 76,8
ni 11
Moda = marca de clase de (60,70] = 65
21
Variabilidad o dispersión
Los estudiantes de estadística reciben diferentes calificaciones en la
asignatura (variabilidad). ¿A qué puede deberse?
Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de
conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.
0.05
Mín. P25 P50 P75 Máx.
Amplitud o Rango :
0.04
Diferencia entre observaciónes extremas.
0.03
2,1,4,3,8,4. El rango es 8-1=7
Es muy sensible a los valores extremos. 25% 25% 25% 25%
0.02
Rango intercuartílico
0.01
Rango intercuartílico : Rango
0.00
Rango intercuartílico = P75 - P25 150 160 170 180 190
Parecida al rango, pero eliminando las observaciones más extremas
inferiores y superiores.
1
S ( xi x )
2 2
n i
Es sensible a valores extremos (alejados de la media).
Energía elástica: Muelles „estirados‟ con respecto a su posición de equilibrio (dispersos) frente
a muelles en posición cercana a su posición de equilibrio (poco dispersos)
24
Desviación típica
Es la raíz cuadrada de la varianza
S S 2
Tiene las misma dimensionalidad 50
(unidades) que la variable. Versión
„estética‟ de la varianza.
40
10
A una distancia de una desv. típica de la Desv. típ. = 568,43
media hay más de la „más de la mitad‟. Media = 2023
0 N = 407,00
1.
1.
2.
2.
2.
3.
50
90
30
70
10
50
90
30
0
0
A una distancia de dos desv. típica de la
0
media las tendremos casi todas. Peso recién nacidos en partos gemelares
25
Dispersión en distribuciones „normales‟
0.05
0.05
0.04
0.04
0.03
0.03
0.02
0.02
0.01
0.01
xs x 2s
68.5 % 95 %
0.00
0.00
150 160 170 180 190 150 160 170 180 190
26
Datos „casi normales‟. Eje „x‟ medido en desviaciones típicas…
¿Encuentras relación entre rango intercuartílico y desviación típica?
¿Y entre los „bigotes‟ y dos desviaciones típicas? ¿Podrías
caracterizar las observaciones anómalas?
0.3
0.3
densidad
densidad
0.2
0.2
xs
0.1
x 2s
0.1
x s x 2s
66 % 95 % 71 % 94 %
0.0
0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
0.4
0.3
0.3
densidad
densidad
0.2
0.2
0.1
x s x 2s
0.1
xs x 2s
68 % 94 % 70 % 94 %
0.0
0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
27
Coeficiente de variación
S
Es la razón entre la desviación típica y la media. CV
Mide la desviación típica en forma de
“qué tamaño tiene con respecto a la media” x
También se la denomina variabilidad relativa.
28
Asimetría o Sesgo
29
Estadísticos para detectar asimetría
Hay diferentes estadísticos que sirven para detectar asimetría.
Basado en diferencia entre estadísticos de tendencia central.
Basado en la diferencia entre el 1º y 2º cuartiles y 2º y 3º.
0.20
0.5
0.20
0.4
0.15
0.15
0.3
0.10
0.10
0.2
0.05
0.05
0.1
xs xs
xs
66 % 78 %
78 %
0.00
0.00
0.0
8 10 12 14 16 18 20 -2 -1 0 1 2 3 0 2 4 6 8 10 12 14
30
x x x
Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribución con respecto a la distribución normal o gaussiana. Es
adimensional.
0.8
0.3
1.5
0.6
0.2
1.0
0.4
0.1
0.5
0.2
x s
xs x s
68 %
57 % 82 %
0.0
0.0
0.0