Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción
2. Análisis básico
2.1. Generalidades
2.2. Gráficos para variables cualitativas
Tema 1 2.3. Variables cuantitativas
2.4. Gráficos para variables cuantitativas
Estadística descriptiva 3. Medidas características
univariable 3.1. Generalidades
3.2. Medidas de tendencia central
3.3. Medidas de dispersión
3.4. Medidas de forma
4. Diagrama de Caja
Carlos Montes – uc3m
1. Introducción 1. Introducción
DATOS (MUESTRA)
¿Qué es la Estadística?
Elementos de información recopilados durante el estudio
(realizaciones de una variable)
Es una herramienta de aprendizaje
a partir de la observación.
* Según su naturaleza, los datos pueden ser: * Según su naturaleza, los datos pueden ser:
1. Introducción 1. Introducción
La cantidad de información
aportada por ambos tipos de variables OBJETIVO:
es muy distinta:
- Variables cualitativas inferir cómo será la población
de la variable de interés
a partir
de la información limitada
que nos aporta la muestra.
+ Variables cuantitativas
2.1. Análisis básico. Generalidades 2.1. Análisis básico. Generalidades
• Frecuencia
A la hora de enfrentarse
– absoluta (f): el número de veces que
a un conjunto de datos
aparece cada dato de la variable.
hay que comenzar realizando
– total (n): número total de datos de
dos operaciones básicas.
la variable (suma de frecuencias
absolutas).
– relativa (fr): cociente entre
ORDENAR RESUMIR frecuencia absoluta y frecuencia total.
de la variable. 40
frequency
30
la frecuencia. 20
0
Piechart for residencia 1 2 3 4
1,05%
12,63% residencia
1
2
3
4
48,42%
Diagrama de tarta
círculo dividido en sectores
37,89%
proporcionales a la
frecuencia de cada valor.
Absolutas
Relativas
Absolutas acumuladas
Relativas acumuladas
2.4. Gráficos para variables cuantitativas 2.4. Gráficos para variables cuantitativas
180
170
160
140
160
120
150 100
80
140
60
40
130
20
120 0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
2.4. Gráficos para variables cuantitativas 2.4. Gráficos para variables cuantitativas
* El polígono de frecuencias es una línea poligonal que * Ambos pueden construirse a partir de las frecuencias
resulta al unir los puntos centrales de la parte superior del acumuladas.
histograma.
3.1. Medidas características. Generalidades 3.1. Medidas características. Generalidades
Podemos distinguir:
* Son aquellas que nos permiten
Tendencia central o centralización:
resumir con un solo número los rasgos
indican el valor medio de los datos.
fundamentales de la distribución.
Dispersión: indican la variabilidad
de los datos.
* Deben acompañarse de herramientas
Forma:
gráficas para evitar errores.
Simetría
Apuntamiento
n
n n n
x j f (x j ) 1) ( x − x ) = x − x = nx − nx = 0
i i
x= n i =1 i =1 i =1
n 2) y = x+k
n
(x + k) x k x
m j f (m j ) y= i =1
i
= n
i
+ n
= n
i
+
nk
= x+k
x= n Error de agrupamiento n n n
n
n n
n kxi xi
3) y = kx y= i =1
=k n
= kx
n n
3.2. Medidas de tendencia central 3.2. Medidas de tendencia central
1, 2, 4, 5, 7, 9, 11, 13 x = 6,5
Moda
Es el valor más frecuente de la
distribución. En variables continuas puede que no se
repita ningún valor.
Es apropiada para datos cualitativos o
cuantitativos discretos.
Pueden existir distribuciones con más de
Pueden existir una o varias modas.
una moda.
En una muestra continua solo podemos hablar de
un intervalo modal (el de mayor densidad de
frecuencia)
3.3. Medidas de dispersión 3.3. Medidas de dispersión
Varianza
Medidas de la separación de los datos
(generalmente, respecto a la media).
∑ ( − ̄) ( )
=
medida
+ representativa
- dispersión
Propiedades de la varianza
Fórmula de cálculo 1) Es una cantidad acotada y positiva
2) La varianza NO se ve afectada por los cambios de
∑ ( ) origen (transformaciones aditivas)
= −!
(x − x)
i
2
sx =
2 n
y = x+k
n
(y i − y)2 (x + k − x − k)
i
2
(x − x)
i
2
sy = = = = sx
2 n n n 2
n n n
3.3. Medidas de dispersión 3.3. Medidas de dispersión
(x − x)i
2
y = kx ̂ =
∑ ( − ̄) ( )
sx =
2 n
n −1
(y i − y)2 (kx − kx )
i
2
k 2 ( xi − x ) 2
sy = = = = k 2 sx
2 n n n 2
n n n
La mayoría de los programas estadísticos calculan la
"# = $ % " cuasivarianza en lugar de la varianza, y la llaman varianza.
Carlos Montes – uc3m
desviación típica
3.3. Medidas de dispersión 3.3. Medidas de dispersión
Cuantiles
Coeficiente de variación
CA = γ 1 = n
Mínimo summarytools
ns 3
Primer cuartil descr ( )
Mediana
Media
Tercer cuartil Ronald Aylmer Fisher
Máximo (1890-1962)
Carlos Montes – uc3m
=3
0,3
0,1
ns 4
0,2
(x − x)
0,1
= i
−3
-5 -3 -1 1 3 5
0,3
Mean,Std. dev.
0,1 construida para mostrar
CAp=0: mesocúrtica 0,2 sus características principales
y señalar los posibles datos atípicos.
0,1
0
-5 -3 -1 1 3 5
CAp>0: leptocúrtica
1,6
1,2
0,8
0,4
0
3,7 4,2 4,7 5,2 5,7 6,2 6,7
1,5
LI= Q1-1,5(Q3-Q1) LS= Q3+1,5(Q3-Q1)
1,2
0,6
LIE= Q1-3(Q3-Q1) LSE= Q3+3(Q3-Q1)
0,3
0
0 0,2 0,4 0,6 0,8 1
4. Diagrama de caja
máx. (no atípico)
Q1 Q3
Q2