Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE INGENIERÍA
UNIDAD I
ESTADÍSTICA DESCRIPTIVA
ANÁLISIS DE DATOS
ESTADÍSTICA
Es el conjunto de métodos necesarios para
recoger, clasificar, representar y resumir datos, así
como para hacer inferencias (extraer
conclusiones) científicas a partir de ellas.
1. ESTADÍSTICA DESCRIPTIVA
TIENE POR OBJETIVO LA RECOGIDA, CLASIFICACIÓN,
REPRESENTACIÓN Y RESUMEN DE LOS DATOS.
2. INFERENCIA ESTADÍSTICA
CONSISTE EN OBTENER CONCLUSIONES.
CONCLUSIONES VÁLIDAS (POBLACIÓN) A PARTIR DE
UNA INFORMACIÓN INCOMPLETA(MUESTRA).
Algunos conceptos imprescindibles
POBLACIÓN
MUESTRA
UNIDAD DE
ANÁLISIS
Tipos de datos y escala de medición
ESCALAS DE MEDICIÓN
Presentación de Datos
*TEXTO
*TABLAS
*GRÁFICOS
DATOS SIN AGRUPAR
VARIABLE CUANTITATIVA
Sea X: “Número de cuadras caminadas
por 14 alumnos de una escuela rural,
para llegar cada mañana”.
5 5 5 6 8 4 4 2 1 8 6 6 4 5
Frecuencia relativa:
Es el cociente entre la frecuencia absoluta fi y el
número total de elementos n de la muestra.
TABLA DE DISTRIBUCIÓN DE
FRECUENCIAS
1 1 0,07 1 0,07
2 1 0,07 2 0,14
4 3 0,21 5 0,35
5 4 0,29 9 0,64
6 3 0,21 12 0,85
8 2 0,15 14 1
Total åf i =14
i
GRÁFICO DE BASTONES
Para una variable cuantitativa con datos sin agrupar
x
GRÁFICO DE ESCALERAS
Para una variable cuantitativa con datos sin agrupar
Gráfico de Frecuencias Acumuladas
15
10
0
0 2 4 6 8 10
X
GRÁFICO DE TALLO Y HOJAS
DIAGRAMA DE PUNTOS
VARIABLE CUALITATIVA
En un estudio realizado por el Instituto del hierro y el acero de Estados Unidos
durante el año 1992, se analizó las cantidades (en miles de toneladas) de
importaciones de acero, en distintos países:
GRÁFICOS: variable cualitativa
GRÁFICOS: variable cualitativa
DATOS AGRUPADOS
HISTOGRAMA
POLIGONO DE FRECUENCIAS
OJIVA
MEDIDAS NUMÉRICAS
DESCRIPTIVAS
MEDIDAS NUMÉRICAS
DESCRIPTIVAS
§ MEDIDAS DE DISPERSIÓN
§ MEDIDAS DE POSICIÓN
§ MEDIDAS DE FORMA
MEDIDAS NUMÉRICAS DESCRIPTIVAS
Media
Medidas de tendencia central Mediana
Moda
Rango
Medidas de dispersión
Varianza
Desviación estándar
Coeficiente de Variación
2 3 4 5 6 7 8 9 10 11 12
TALLERES FIX: segunda sucursal
2 3 4 5 6 7 8 9 10 11 12
TALLERES FIX: tercera sucursal
¿Cuanto de moraron en promedio en armar una transmisión?
2 3 4 5 6 7 8 9 10 11 12
MEDIA
N
2
12
3 4 5 6 7 8 9 10 11
å xi
i =1
x=
n
N 12
åx åx
2 3 4 5 6 7 8 9 10 11 12
i i
x= i =1
= i =1
=8
n 12
2 3 4 5 6 7 8 9 10 11 12
MEDIANA
Xme = 6
MEDIANA
1º
2º
3º
4º
5º
6º
~
x =8 7º
8º ¿Cuál es el valor de la Mediana en cada sucursal?
9º
10º
11º
12º xn + xn
+1
Datos pares ® ~
x=
2 3 4 5 6 7 8 9 10 11 12 2 2
2
~ 9 + 12 7º
x= = 10,5 8º
9º
2º 2 10º
3º 11º
1º 4º 5º 6º 12º Orden de la mediana entre el 6º y 7º
2 3 4 5 6 7 8 9 10 11 12
Moda:8
2 3 4 5 6 7 8 9 10 11 12
Moda:12
2 3 4 5 6 7 8 9 10 11 12
Moda:8
2 3 4 5 6 7 8 9 10 11 12
MODA
¿Cuál es el valor de la moda en esta nueva sucursal?
NO HAY MODA
2 3 4 5 6 7 8 9 10 11 12
VARIABLE VARIABLE
CUALITATIVA CUANTITATIVA
Moda Moda
Moda Mediana Mediana
Media Aritmética
MEDIDAS DE DISPERSIÓN
§ RANGOS
§ VARIANZA
§ DESVIACIÓN ESTÁNDAR
§ COEFICIENTE DE VARIACIÓN
MEDIDAS DE DISPERSIÓN
Grupo 2 Grupo 3
20 20
15
15
10
f 10
5
5
0
0 1 2 3 4 5 6
1 2 3 4 5 6
R. Correctas R. Correctas
R = xmax - xmin = 12 - 2 = 10
2 3 4 5 6 7 8 9 10 11 12
RANGO – RANGO INTERCUARTIL-
RANGO INTERDECIL
R = xmax - xmin
El rango proporciona una rápida
indicación de la variabilidad existente
entre las observaciones de un conjunto
de datos.
La diferencia entre los percentiles 75avo
y 25avo recibe el nombre de recorrido
intercuartil, sólo incluye el 50% central
de la distribución.
MEDIDAS DE DISPERSIÓN
2
å
nn
(x
ii==11 ii
- x)
( xi - x)
2 3 4 5 6 7 8 9 10 11 12
MEDIDAS DE DISPERSIÓN
DESVIACIÓN
VARIANZA ESTÁNDAR
MUESTRAL MUESTRAL
2 2
åi=1 ( xi - x)
n
åi=1 ( xi - x)
n
2
s = s =
n -1 n -1
( xi - x)
2 3 4 5 6 7 8 9 10 11 12
VARIANZA – DESVIACIÓN
ESTÁNDAR
La varianza de las observaciones x1, x2,.....,
xn es el promedio del cuadrado de las
distancias entre cada observación y la media
del conjunto de observaciones.
n
å ( xi - x ) 2
s2 = i
n -1
Desviación estándar
å ( xi - x ) 2
s= i
n -1
DESVIACIÓN ESTÁNDAR
COEFICIENTE DE VARIACIÓN
!
• CV = #"
• Es adimensional
Permite efectuar comparaciones de
distribuciones de distintas poblaciones.
Ejemplo: Nos permite compara quién tiene
mayor variabilidad ; “Las alturas de los elefantes
(m)” o “Las alturas de las hormigas (mm)”
Nos dice que proporción de la media representa
la desviación estándar.
MEDIDAS DE POSICIÓN
§ CUARTILES
§ DECILES
§ PERCENTILES
CUARTILES, DECILES, PERCENTILES
7º
8º
9º
2º 10º Orden de las medidas de posición
3º 11º
1º 4º 5º 6º 12º
2 3 4 5 6 7 8 9 10 11 12
12 + 1 n +1
Q = 1
º
1 = 3,25 ® Q1 = 3 Q =
º
k k
4 4
n +1
Dkº = k
12 + 1 10
D = º
6 = 7,8 ® D6 = 12
6
10 n +1
Pk =
º
k
100
12 + 1
P70º = 70 = 9,1 ® P70 = 12
100
Representación de las Medidas de
Posición
Si bien estas medidas de posición, incluso la mediana
se pueden marcar en el histograma,
D2=160,39 Q3=173,06
Me=167,57 P95=180,25
Medidas de posición en la curva
ojiva
Estas medidas son más fáciles de ubicar en la curva ojiva:
Me=167,57
Representación de deciles y
percentiles
DIAGRAMA DE CAJA
También se llama diagrama de las cinco letras
porque permite visualizar rápidamente : el valor
mínimo, el valor máximo, y los tres cuartiles.
También tiene la ventaja de representar a los
llamados valores apartados.
Los valores apartados, son aquellos que son
muy grandes o muy pequeños en comparación
con el conjunto de datos que se están
analizando.
Además, nos da una idea de la variabilidad
presente en el conjunto de datos. A mayor
longitud corresponde mayor variabilidad
DIAGRAMA DE CAJA
DIAGRAMA DE CAJA
* * +
+ * *
1 2 3 4 5 6 7 8 9 10
DIAGRAMA DE CAJA
x: Media muestral Referencias:
Me: Mediana Ref 1: Q1 – 3.RI
Q1: Primer cuartil Ref 2: Q1 – 1,5.RI
Q3: Tercer cuartil Ref 3: Q3 + 1,5.RI
RI: Rango intercuartílico Ref 4: Q3 + 3.RI
+ *
x
Ref1 Ref2 Q1 x Q3 Ref3 Ref4
Me
DIAGRAMA DE CAJA
+ *
x
Ref1 Ref2 Q1 x Q3 Ref3 Ref4
Me
Veamos algunos ejemplos especiales
xi fi Fi Medidas:
Medidas:
1 1 1 • Media=1011,486
2 1 2 Me=?
• Me=1020
1000 100 102
• Q1=1010
1010 120 222
• Q3=1020
1020 180 402
1030 98 500 • RI=10
N=500 • REF1=980
• REF2=995
• REF3=1035
• REF4=1050
MEDIDAS DE FORMA
§ ASIMETRÍA o SESGO
§ APUNTAMIENTO o CURTOSIS
MEDIDAS DE FORMA
§ ASIMETRÍA o SESGO
%$ − '(
!" =
)
0.8
0.6
0.4
0.2
0.0
0 2 4 6 8
§ APUNTAMIENTO o CURTOSIS
Mide como se concentran los datos alrededor de su
media. Es una medida de qué tan puntiaguda es la
distribución de los valores de la variable.
Ejercicio 1-7
Asimétrica a derecha o positivamente
asimétrica