Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DESCRIPTIVA
DATOS SIN AGRUPAR
Y DATOS AGRUPADOS
Clase #2
Ing. Yendry Fernández Mora
Basado en el material de las Ingenieras Patricia Ramírez y Melissa Pizarro
AGENDA
DE LA SESIÓN
1. Organización y presentación de datos sin
agrupar.
28/03/16
DATOS
SIN AGRUPAR
medidas de tendencia central,
posición, dispersión y forma
MEDIDAS
TENDENCIA CENTRAL
MODA
MEDIA
MEDIANA
MODA
Aquel valor de la variable que más se repite; es decir, con
la frecuencia mayor (que puede no ser un único valor)
x fi fir Fi Fir
126 1 6,7% 1 6,7%
135 1 6,7% 2 13,3%
138 2 13,3% 4 26,7%
140 1 6,7% 5 33,3%
142 1 6,7% 6 40,0%
145 1 6,7% 7 46,7%
146 2 13,3% 9 60,0%
150 1 6,7% 10 66,7%
158 1 6,7% 11 73,3%
161 1 6,7% 12 80,0%
164 1 6,7% 13 86,7%
168 1 6,7% 14 93,3%
173 1 6,7% 15 100,0%
Total 15 100,0%
Clase 2 Inga. Yendry Fernández Mora 7
MEDIANA
Determina el valor que tiene aquella
observación que divide la cantidad de
observaciones en dos mitades iguales.
x 0.5
En EXCEL, fx ..
•Estadísticas
•MEDIANA
1 2 3 3 4 5 7 8 9
7 eventos
en caso de que N sea impar
1 2 3 3 4 5 7 9
8 eventos
10
(3+4)/2=3.5
Clase 2 Inga. Yendry Fernández Mora
MEDIA
MEDIA ARITMÉTICA O PROMEDIO
En EXCEL, fx ..
•Estadísticas
•PROMEDIO
Clase 2 Inga. Yendry Fernández Mora 11
MEDIA
MEDIA ARITMÉTICA O PROMEDIO
Propiedad importante:
Solución:
-1,30 -1,25 -1,04 -0,85 -0,60 -0,50 -0,43 -0,12 -0,06 0,25 0,35 0,56 0,95 1,51 2,07
Moda #N/A
Mediana -0,12
Media -0,03
PERCENTILES CUARTILES
DECILES
CUANTILOS
Igual que se divide en dos partes iguales un
conjunto de datos cuando se calcula la mediana, se
puede dividir el conjunto de datos en más partes
iguales. Por ejemplo los percentiles permiten
dividir el conjunto de datos en cien partes
iguales. Con los cuartiles se divide en cuatro partes
iguales, con los deciles en diez y así sucesivamente.
16
PERCENTILES
𝑃𝑚=(m/100) (n + 1)
Donde:
término m : percentil de interés
1 ≤ m ≤ 99
n : número de observaciones
17
EJERCICIO
Calcule: P25, P75, P30 y P45
EJERCICIO 1,21
1,21
1,21
1,24
1,25
1,25
1,28
1,28
1,28
1,21 1,26 1,29
1,22 1,26 1,29
Percentiles: p/100*(n) 1,22 1,26 1,29
1,22 1,27 1,3
1,22 1,27 1,3
1,23 1,27 1,3
Cálculo de la
Percentil Posición Posición Resultado
(7+1)/4=2 (8+1)/4=2,25
1 2 3 3 4 5 7
1 2 3 3 4 5 7 9
7 datos 8 datos
Clase 2 Inga. Yendry Fernández Mora 23
MEDIDAS
DISPERSIÓN
DESVIACIÓN ESTÁNDAR
VARIANZA
COEFICIENTE DE VARIACIÓN
RANGO
RANGO INTERCUARTIL
MEDIDAS DE DISPERSIÓN
Permiten retratar la distancia de los valores
de la variable a un cierto valor central, o
identificar la concentración de los datos en un
cierto sector del recorrido de la variable.
Rango semi-intercuartil
= 1/2 *RI
Percentil Resultado
75 0,56
Posición Posición límite 12 Valor límite 0,56
Intercuartil 1,41
1,29 1,28 1,21 1,27 1,20 1,22 1,24 1,25 1,23 1,30 1,22 1,26 1,25 1,23 1,21
1,28 1,26 1,29 1,27 1,30 1,26 1,21 1,21 1,22 1,22 1,28 1,28 1,29 1,30 1,27
Prepare una tabla de distribución de frecuencia de los resultados
obtenidos
u
Supongamos este
ejemplo
N Al cuadrado
Al cuadrado
Al cuadrado
x1 x2 u xn
poblacional
30 – 34 29,5 – 34,5
35- 39 34,5 – 39,5
40 – 44 39,5 – 44,5
Clase 2 Inga. Yendry Fernández Mora 44
EJEMPLO
Frecuencia Frecuencia
Límite Límite Frecuencia Frecuencia
Clase Absoluta Relativa
inferior superior Absoluta Relativa
Acumulada Acumulada
1 -0,25 1,85 10 10 20% 20%
2 1,85 3,95 13 23 26% 46%
3 3,95 6,05 19 42 38% 84%
4 6,05 8,15 6 48 12% 96%
5 8,15 10,25 2 50 4% 100%
50 100%
Recuerde:
El primer paso para construir la tabla de la
distribución de frecuencias es identificar el x menor y el
x mayor, luego ordenar y contar las fi
Las clases deben ser
Pertinentes La diferencia
entre el x mayor y el
Exhaustivas
x menor se conoce
Mutuamente
excluyentes
como Rango: R
la clase con mayor densidad de frecuencias.
d1
M o Li IC
Li= límite inferior real de la clase modal.
d1 d 2
d1= diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
anterior.
d2= diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
posterior.
IC =intervalo de clase modal
4 6,05 8,15 6 48 12% 96%
5 8,15 10,25 2 50 4% 100%
50 100%
6
M o =3,95+ ⋅(6,05−3,95 )=4,613
6+13
d1
M o Li IC
d1 d 2
Probabilidad y Estadística I Clase 3 48
Medidas de posición (tendencia central)
en datos agrupados.
LA MEDIANA
Datos sin agrupar: Es el valor central de
una serie de datos.
Datos agrupados: En
una distribución
continua, el valor correspondiente a la
mediana divide el área bajo la curva en
dos partes iguales.
N = número total de observaciones o suma de las frecuencias
absolutas.
Li = límite inferior real de la clase donde está la mediana.
fi= frecuencia absoluta de la clase donde está la mediana.
Fa = frecuencia acumulada “menos de” de la clase anterior a la
clase donde está la mediana.
IC =intervalo de clase donde está la mediana.
3 3,95 6,05 19 42 38% 84%
4 6,05 8,15 6 48 12% 96%
5 8,15 10,25 2 50 4% 100%
50 100%
N
1. Encuentro la posición Fa
N/2 = 50/2 =25 M e Li 2 IC
f
25−23
M e=3,95+ ⋅(6,05−3,95 )=4,171
19 Probabilidad y Estadística I Clase 3
51
Medidas de posición (tendencia central)
en datos agrupados.
k k
fx fx i i i i
MEDIA
x i 1
k
i 1
n
Datos sin agrupar: promedio simple. f i 1
i
En una distribución de frecuencias se
conoce el número de observaciones
que hay dentro de una clase, pero no se sabe el valor exacto de cada una
de ellas.
1. Se divide entre N.
201,7/50 = 4,034
Probabilidad y Estadística I Clase 3 54
Medidas de posición (tendencia central)
en datos agrupados.
PERCENTILES
15
m
n Fa
Pm Li 100 IC
f
15−10
Pm=1,85+ ⋅(3,95−1,85)=2,658
13
Probabilidad y Estadística I Clase 3 57
DESVIACIÓN ESTÁNDAR
Para datos agrupados
•Histogramas
•Polígonos de frecuencia
•Ojivas
•Gráficos de caja
•Curtosis
Curtosis
Caracteriza el grado de elevación o achatamiento de una distribución
comparada con la distribución normal.
LEPTOCÚRTICA: k>0 Más “picuda” que la normal (pico).
PLATICÚRTICA: k<0 Más chata que la normal.
MESOCÚRTICA: K=0 Igual que la normal.
Es una razón de la amplitud semintercuartil, es decir, la mitad del
valor de la amplitud intercuartil y la amplitud 90-10 percentil.
k= ( 1 / 2 ( x . 75 − x . 25 ))/ ( x . 90 − x . 10 )
I semestre 08 62
Histograma.
Las características geométricas del histograma
nos permiten descubrir información útil sobre
los datos, por ejemplo:
1. La localización del “centro” de los datos.
2. El grado de dispersión.
3. La sección a la cual se sesga, es decir, cuando
no cae simétricamente en ambos lados del
pico.
4. El grado de agudeza del pico. Cómo se levanta
y baja la pendiente
Menor que
porcentual
Menor
que
Percentil Resultado
25 30,000
Posición Posición límite 10 Valor límite 30,000
Posición a Valor a
10,25 interpolar 0,25 interpolar 30,000
Interpolación 0,00
Intercuartil 5,75
Desviación
estándar
MUESTR
AL 3,404