Documentos de Académico
Documentos de Profesional
Documentos de Cultura
it happen
Estadística Descriptiva
Fundamentos de Estadística
eae.es
Estadística Descriptiva
Índice
2
Estadística Descriptiva
eae.es
3
Estadística Descriptiva
• El término estadística comparte raíz con la palabra estado, teniendo ambas un sentido tanto de
situación como un sentido político de nación. Durante siglos, el significado de estadística ha sido la
descripción del estado de la nación.
• La primera noticia que tenemos de un estudio estadístico se remonta a lo que nos explica Herodoto: el
primer censo del que se tiene conocimiento, realizado en Egipto con el fin de la construcción de las
pirámides. Posteriormente, Roma utilizó continuamente la estadística en su administración.
• Para la estadística actual es fundamental el cálculo de probabilidades. Hacia el s. XVI se dieron los
primeros avances con G. Cardano y N. Tartaglia. Grandes estudiosos de la Estadística de este siglo
fueron J. Bernoulli, que ayudó a dar los primeros pasos de esta disciplina y T. Bayes, cuyo teorema
lleva su nombre.
• Ya en el s. XIX, P. S. Laplace publicó “Théorie analityque des probabilités”, que sirvió de base para los
posteriores trabajos de C.F. Gauss o S.D. Poisson, que desarrollaron el cálculo de probabilidades a lo
largo del siglo.
4
Estadística Descriptiva
• Cabe destacar la importancia de los trabajos del botánico G. J. Mendel en el campo de la genética, y
los estudios de F. Galton respecto a la correlación y los fundamentos en los que se basa el actual
análisis de regresión.
• Gracias a todos ellos en todos los medios podemos obtener gran cantidad de información estadística.
La estadística forma parte de nuestra vida cotidiana.
5
Estadística Descriptiva
La estadística es una disciplina que recoge un conjunto de técnicas que nos permiten recopilar, organizar,
analizar, interpretar y representar datos (numéricos) para deducir resultados posibles o consecuencias
sobre un fenómeno.
La estadística es una ciencia que trabaja con datos numéricos y que nos ayuda a responder preguntas.
Por ejemplo, en economía y negocios, la información obtenida al reunir datos, analizarlos, presentarlos e
interpretarlos, proporciona a las personas que deben tomar decisiones una mejor comprensión del
negocio o entorno económico, permitiéndoles así tomar mejores decisiones con base en mejor
información.
6
Estadística Descriptiva
¿Qué es la estadística?
Impresiones
Opiniones
Suposiciones
Prejuicios
? DATOS !
…
7
Estadística Descriptiva
¿Qué es la estadística?
ESTADÍSTICA
Disciplina que estudia cómo recoger datos y como
analizarlos para obtener la información deseada.
8
Estadística Descriptiva
Productos
o servicios
Entradas PROCESO
ESTADÍSTICA DATOS
Mejora del
producto y
del proceso
INFORMACIÓN ESTADÍSTICA
9
Estadística Descriptiva
Estadística &
Manegment
30
20
10
40 43 46 49 52 55 58
378498947362394940
Pareto Chart for C1
274948599876537383
200
932849276732904854 100
80
283928985940903850
Percent
Count
60
239832795059049044 100
40
094385040049850385 20
987897899893222341 0
n
0
s ras a c ió rs
du ina
283928985940903850 Ra
ya
So
pla Fo
rm
T erm Ot
he
239832795059049044
094385040049850385 y = 133,5
987897899893222341 s = 7,41
40
Respuesta
Datos a preguntas
C4
30
20
20 30 40 50
C1
10
Estadística Descriptiva
Estadística &
Manegment
Contabilidad
Finanzas
Diagnóstico:
Aplicación
Análisis y
Recogida de Inferencia en los
Resumen de
datos estadística negocios y
datos
en
economía Marketing
Producción
Economía
11
Estadística Descriptiva
Estadística &
Manegment
12
Estadística Descriptiva
Estadística &
Manegment
13
Estadística Descriptiva
Estadística &
Manegment
14
1. La estadística descriptiva – Fundamentos de estadística.
Definiciones
La estadística descriptiva.
Universo
Conjunto de individuos que
presentan la característica
Muestra que nos interesa estudiar
Subconjunto representativo
de una población que se
utiliza para explicar (inferir)
características del conjunto
de esta población
Generalmente, se simboliza
con la letra n
Población
Es el conjunto total (finito
o infinito) de individuos u
elementos que
Individuo
presentan una misma
Un individuo o unidad
característica. Son objeto
estadística es cada uno de
de estudio y de los que se
los elementos que
requiere información
componen la población
Generalmente, se
simboliza con la letra N
15
Probabilidad e Inferencia
POBLACIÓN POBLACIÓN
?
Probabilidad Estadística / Inferencia
?
MUESTRA MUESTRA
Fundamentos de Estadística Estadística y Análisis de Datos
16
Estadística Descriptiva
17
Estadística Descriptiva
18
Estadística Descriptiva
eae.es
19
Estadística Descriptiva
La base de datos
Xi: Variables
ni: Individuos
20
Estadística Descriptiva
Para poder escoger o introducir las variables e estudiar, hay que CONOCERLAS.
VARIABLES
CUALITATIVA CUANTITATIVA
Valores no numéricos Valores numéricos
21
Estadística Descriptiva
Hombre/ mujer
Dicotómicas Propio/ajeno
Dos categorías
Cualitativas Nominal / Ordinal
Discretas Nº hijos
Libros en la mochila
Es un número concreto de Nº corredor de seguros
Cuantitativas valores.
Nominal/ordinal Peso
Categorías Continuas Altura
característica no
numérica Puede tomar cualquier valor. Tiempo
Entre dos valores, siempre hay
un intermedio
Se puede agrupar en intervalos.
22
Estadística Descriptiva
Ejercicio
TIPO DE VARIABLE
23
Estadística Descriptiva
eae.es
24
94,95
59,91 Estadística Descriptiva
63,65
104,21
68,72
Síntesis numérica de datos 71,26
85,39
77,30
121,43
94,95 94,95 91,52
59,91 59,91 95,52
63,65 63,65 126,74
104,21 104,21 79,08 Medidas de tendencia central
68,72 68,72 130,79
71,26 71,26 109,62 Media, Mediana y Moda
85,39 85,39 65,19
77,30 77,30 126,02
121,43 121,43 137,61
91,52 91,52 63,90
95,52 95,52 94,95
?
126,74
79,08
126,74
79,08
59,91
63,65
Medidas de dispersión
104,21
Rango, Varianza, Desviación
130,79 94,95
130,79
109,62 59,91
109,62 68,72
65,19 63,65
65,19 71,26
126,02 104,21
126,02 85,39 tipo
137,61 68,72
137,61 77,30
63,90 71,26
63,90 121,43
85,39
77,30
91,52
95,52
Medidas de posición
126,74
Cuartiles, percentiles
121,43
91,52 79,08
95,52 130,79
126,74 109,62
79,08 65,19
130,79
109,62
126,02
137,61
Medidas de relación entre dos variables
63,90
65,19
126,02 Covarianza, correlación
137,61
63,90 25
Estadística Descriptiva
Tendencia central:
media
Frecuencia Valor de la
absoluta ni: variable: Xi
Tendencia central:
mediana
No tiene fórmula. Poco influenciable por valores extremos
Ordenar los
Número impar de datos: Valor que queda en el centro
valores
de menor a Número par de datos: Promedio de los 2 centrales
mayor:
Mediana
0 1 2 3 4 5 6 7 8 9 10 27
Estadística Descriptiva
Tendencia central:
moda
Valor que más se repite
Apenas se usa con valores numéricos
Puede no haber moda
Distribución bimodal
150
100
50
40 50 60 70
28
Estadística Descriptiva
Posición: cuartiles
Menor 50
52
57
58
59
60 25 %
61
61 Q1 = 61: Primer Cuartil
61
64
68 75 %
Datos ordenados
69 50 %
de menor a mayor 71
72
73
78
75,5 Mediana
78
80
81 50 %
82 75 %
82
84
86 Q3 = 86: Tercer Cuartil
90
92
93
25 %
94
95
98
Mayor 100 29
Estadística Descriptiva
Percentiles (Pi)
Dividen en 100 partes
iguales: hay 99
centiles
Deciles (Di)
Dividen en 10 partes
iguales: hay 9
quartiles
Cuartiles (Ci)
Dividen en 4 partes
iguales: hay 3
quartiles
30
Estadística Descriptiva
Dispersión: rango
0 1 2 3 4 5 6 7 8 9 10
31
Estadística Descriptiva
Dispersión:
varianza
“Promedio” del cuadrado de las distancias de cada valor a la media
MUESTRA POBLACIÓN
n n
xi x xi
2 2
s2 = i=1 2 = i=1
n- 1 N
Dispersión:
varianza
2,6 2,4
3,6 4,4
0 1 2 3 4 5 6 7 8 9 10
33
4,6
Estadística Descriptiva
Dispersión:
desviación tipo
Medida de dispersión de uso cotidiano
MUESTRA POBLACIÓN
s = s2 = 2
Dispersión:
coeficiente de variación
Expresa la relación que hay entre la desviación típica de una muestra y su media aritmética).
Al no tener unidades, nos permite comparar diferentes muestras. Con ello sabremos qué
muestra es más representativa en relación a sus desviaciones a menor Cv, más concentrada
está la muestra y más representativa es.
𝒔
Cv=
𝑿
Estadística Descriptiva
Medidas de relación
lineal entre 2
variables n
(x x)(yi i y) 10
Cov(X, Y) i1 Negativa I II Positiva
n1 9 (+ · -) (+ · +)
8
- +
7
Cov (X,Y) > 0: + +
6
Relación positiva
Y 5 Media de Y
- -
4
Cov (X,Y) < 0:
Relación negativa 3
- +
2
1 Positiva Negativa
Cov (X,Y) 0: (- · -) Media de X (- · +)
No hay relación 0 IV III
0 1 2 3 4 5 6 7 8 9 10
X
36
INCONVENIENTE: Depende de las unidades de las variables
Estadística Descriptiva
Medidas de relación
lineal entre 2
variables
El coeficiente de correlación resuelve los problemas de la covarianza
Unidades: Es adimensional
r = 0,779
r = - 0,160
37
03. Representaciones gráficas
eae.es
38
Estadística Descriptiva
Histogramas
Utilidad
Ventajas
• Revela la media, la variabilidad de los datos y la
forma de la distribución
Limitaciones
No refleja la información temporal de los datos
40
Estadística Descriptiva
El caso de la
panadería
Día Ope. Máquina 1 Máquina 2
41
Estadística Descriptiva
Histogramas:
Visión general
35 30
30
25
25
20
20
15
15
10
10
5 5
0 0
205 210 215 220 225 230 235 205 210 215 220 225 230 235
Pesos Pesos
42
Estadística Descriptiva
Histogramas:
Comparación
Operario A Operario B
Porcentaje Porcentaje
35 35
30 30
25 25
20 20
15 15
10 10
5 5
0 0
205 210 215 220 225 230 235 205 210 215 220 225 230 235
Pesos Pesos
43
Estadística Descriptiva
Histogramas:
Comparación (2)
Máquina 1 Máquina 2
Porcentaje Porcentaje
35 35
30 30
25 25
20 20
15 15
10 10
5 5
0 0
205 210 215 220 225 230 235 205 210 215 220 225 230 235
Pesos Pesos
44
Estadística Descriptiva
Histogramas:
Ejercicio
Máquina 1 Máquina 3
Porcentaje Porcentaje
35 25
30
20
25
20 15
15
10
10
5
5
0 0
205 210 215 220 225 230 235 212 214 216 218 220 222 224 226 228
Pesos Pesos
45
Estadística Descriptiva
Histogramas: Tipos
150 150
80
100 100
40
50
50
0 0 0
30 35 40 45 50 55 60 65 70 25 30 35 40 45 50 55 60 65 70 75 0 5 10 15 20 25
50 50 50
0 0 0
35 40 45 50 55 60 65 70 75 80 85 90
30 35 40 45 50 55 60 65 70 35 40 45 50 55 60 65 70 75 80 85 90
Orden: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Q1 Mediana Q3
* * * o
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
48
Estadística Descriptiva
10
200
Humedad
Weight
9
150
100
8
Sex
49
Estadística Descriptiva
Ventajas
• Recopilan de manera lineal en períodos de tiempo
adyacentes, potencialmente puede establecer
correlaciones, patrones, tendencias…
• Visión general en aspectos micro/macro económicos
Limitaciones
Escasez de la recogida de datos longitudinales
50
Estadística Descriptiva
Time
51
Estadística Descriptiva
52
Estadística Descriptiva
Diagramas
bivariantes:
correlación causa y
efecto
Utilidad
Identifica correlación entre variables. También indica
la intensidad de la correlación.
Ventajas
• Ayuda a identificar que entrada o variable del
proceso puede estar relacionada con una salida del
proceso.
Diagramas
bivarantes
54