Está en la página 1de 71

ESTADÍSTICA

DESCRIPTIVA
DATOS SIN AGRUPAR
Y DATOS AGRUPADOS

Clase #2
Ing. Yendry Fernández Mora
Basado en el material de las Ingenieras Patricia Ramírez y Melissa Pizarro
AGENDA
DE LA SESIÓN
1. Organización y presentación de datos sin
agrupar.

2. Distribuciones de frecuencia (relativas y


acumulativas)

3. Descripción numérica de datos sin agrupar:


medidas de tendencia central, posición y
dispersión.

Clase 2 Inga. Yendry Fernández Mora 2


DATO E INFORMACIÓN

28/03/16
DATOS
SIN AGRUPAR
medidas de tendencia central,
posición, dispersión y forma
MEDIDAS
TENDENCIA CENTRAL
MODA

MEDIA

MEDIANA
MODA
Aquel valor de la variable que más se repite; es decir, con
la frecuencia mayor (que puede no ser un único valor)

la moda es la medida más usada para la


tendencia central de variables
cualitativas

Siempre que exista más de una moda, la población de la


cual la muestra es obtenida es una mezcla de más de
una población.
En EXCEL, fx ..
•Estadísticas
•MODA
ADVERTENCIA: solamente informa
sobre la PRIMERA moda que encuentra
Clase 2 Inga. Yendry Fernández Mora 6
En nuestro ejemplo, tenemos una condición bimodal

x fi fir Fi Fir
126 1 6,7% 1 6,7%
135 1 6,7% 2 13,3%
138 2 13,3% 4 26,7%
140 1 6,7% 5 33,3%
142 1 6,7% 6 40,0%
145 1 6,7% 7 46,7%
146 2 13,3% 9 60,0%
150 1 6,7% 10 66,7%
158 1 6,7% 11 73,3%
161 1 6,7% 12 80,0%
164 1 6,7% 13 86,7%
168 1 6,7% 14 93,3%
173 1 6,7% 15 100,0%
Total 15 100,0%
Clase 2 Inga. Yendry Fernández Mora 7
MEDIANA
Determina el valor que tiene aquella
observación que divide la cantidad de
observaciones en dos mitades iguales.

x 0.5

En EXCEL, fx ..
•Estadísticas
•MEDIANA

Clase 2 Inga. Yendry Fernández Mora 8


MEDIANA
Ordenados los valores de menor a mayor,
determina el valor que tiene aquella observación
que divide la cantidad de observaciones en
dos mitades iguales
x 0.5
Por ejemplo:
3 2 3 5 7 9 1 4 8

1 2 3 3 4 5 7 8 9

Clase 2 Inga. Yendry Fernández Mora 9


MEDIANA 50 50
% %
2 3 3 4 5 7 9

7 eventos
en caso de que N sea impar

en caso de que N sea par

1 2 3 3 4 5 7 9

8 eventos
10

(3+4)/2=3.5
Clase 2 Inga. Yendry Fernández Mora
MEDIA
MEDIA ARITMÉTICA O PROMEDIO

En EXCEL, fx ..
•Estadísticas
•PROMEDIO
Clase 2 Inga. Yendry Fernández Mora 11
MEDIA
MEDIA ARITMÉTICA O PROMEDIO

Propiedad importante:

Clase 2 Inga. Yendry Fernández Mora 12


x fi fir
126 1 6,7%
135 1 6,7%
138 2 13,3%
140 1 6,7%
142 1 6,7%
Media 148,7 145 1 6,7%
146 2 13,3%
Mediana 146 150 1 6,7%
Moda 138 158 1 6,7%
161 1 6,7%
y 146 164 1 6,7%
168 1 6,7%
173 1 6,7%
Total 15 100,0

Clase 2 Inga. Yendry Fernández Mora 13


EJERCICIO
Sean los siguientes resultados de un muestreo
aleatorio simple de cierto experimento. Determine
las medidas de tendencia central vistas hasta
ahora. 1,51 -0,12 0,35 -0,60 -0,85
0,56 -0,06 0,95 0,25 -1,04
-1,30 -0,43 -1,25 2,07 -0,50

Solución:
-1,30 -1,25 -1,04 -0,85 -0,60 -0,50 -0,43 -0,12 -0,06 0,25 0,35 0,56 0,95 1,51 2,07

Moda #N/A
Mediana -0,12
Media -0,03

Clase 2 Inga. Yendry Fernández Mora 14


MEDIDAS
POSICIÓN
CUANTILOS

PERCENTILES CUARTILES

DECILES
CUANTILOS
Igual que se divide en dos partes iguales un
conjunto de datos cuando se calcula la mediana, se
puede dividir el conjunto de datos en más partes
iguales. Por ejemplo los percentiles permiten
dividir el conjunto de datos en cien partes
iguales. Con los cuartiles se divide en cuatro partes
iguales, con los deciles en diez y así sucesivamente.

16
PERCENTILES

𝑃𝑚=(m/100) (n + 1)

Donde:
término m : percentil de interés
1 ≤ m ≤ 99
n : número de observaciones

17
EJERCICIO
Calcule: P25, P75, P30 y P45

Clase 2 Inga. Yendry Fernández Mora 18


1,2 1,23 1,28

EJERCICIO 1,21
1,21
1,21
1,24
1,25
1,25
1,28
1,28
1,28
1,21 1,26 1,29
1,22 1,26 1,29
Percentiles: p/100*(n) 1,22 1,26 1,29
1,22 1,27 1,3
1,22 1,27 1,3
1,23 1,27 1,3

Cálculo de la
Percentil Posición Posición Resultado

P25 (25/100)*31 7.75 1.22

P75 (75/100)*31 23.25 1.28

P30 (30/100)*31 9.3 1.22+0.3(1.23-1.22)=1.223

P45 (45/100)*31 13.95 1.25

Clase 2 Inga. Yendry Fernández Mora 19


EJERCICIO
N° Dato N° Dato
1 15 17 18
2 20 18 25
Con los datos de la edad de los
3 18 19 22
pacientes que asistieron a la
4 23 20 24
Clínica la Fuente de la Salud en
5 24 21 34
el mes de abril del 2009, se
6 22 22 35
calculará algunos percentiles:
7 28 23 21
8 34 24 22
Percentil 25?
9 39 25 23
10 40 26 28
Percentil 60?
11 23 27 32
12 22 28 22
Interprete los resultados:
13 29 29 23
14 35 30 34
15 45 31 38
16 40
28/03/16 20
N:
N° Dato N° Dato
1 15 17 25
Con los datos de la edad de los pacientes 2 18 18 28
que asistieron a la Clínica la Fuente de la 3 18 19 28
Salud en el mes de abril del 2009, se 4 20 20 29
calculará algunos percentiles:
5 21 21 32

Percentil 25: 8 posición 6 22 22 34


7 22 23 34
Percentil 60: 19.2 8 22 24 34
9 22 25 35
Interprete los resultados:
10 22 26 35
El 25% de los pacientes que visitaron la
Clínica La Fuente de la Salud, en el mes de 11 23 27 38
abril del 2009, tienen una edad de 22 años 12 23 28 39
o menos y el 75% restante tienen una edad 13 23 29 40
de 22 años o más. 14 23 30 40
15 24 31 45
16 24
28/03/16 21
percentiles
Cuartiles: “Q”, cuando se divide la distribución en
4 partes iguales.
Se llama primer cuartil Q1 al menor valor que supera
– o que deja por debajo de él- a la cuarta parte de
los datos.
Por ejemplo, sean los siguientes datos
3 2 3 5 7 9 1 4
Ordenamos los datos de menor a
mayor
1 2 3 3 4 5 7 9
Primer Tercero Cuarto
cuartil Sgdo

Clase 2 Inga. Yendry Fernández Mora 22


Cuartiles, deciles y percentiles
Cuartiles:

(7+1)/4=2 (8+1)/4=2,25

1 2 3 3 4 5 7
1 2 3 3 4 5 7 9
7 datos 8 datos
Clase 2 Inga. Yendry Fernández Mora 23
MEDIDAS
DISPERSIÓN
DESVIACIÓN ESTÁNDAR
VARIANZA
COEFICIENTE DE VARIACIÓN
RANGO
RANGO INTERCUARTIL
MEDIDAS DE DISPERSIÓN
Permiten retratar la distancia de los valores
de la variable a un cierto valor central, o
identificar la concentración de los datos en un
cierto sector del recorrido de la variable.

Se determina para variables cuantitativas.

Clase 2 Inga. Yendry Fernández Mora 25


MEDIDAS DE DISPERSIÓN
RANGO INTERCUARTIL
El rango intercuaril es la diferencia entre el
tercer y el primer cuartil

Esto nos dice en cuántas unidades de los


valores que toma la variable se concentra el
cincuenta por ciento central de los casos.

Rango semi-intercuartil
= 1/2 *RI

Clase 2 Inga. Yendry Fernández Mora 26


x fi
Primero establecemos la POSICION 126 1 6
135 1 6
138 2 13
140 1 6
142 1 6
145 1 6
OJO: este es el valor de la 146 2 13
POSICION, no del cuartil 150 1 6
solicitado 158 1 6
Primer cuartil
161 1 6
Posición (n+1)/4 4,0 164 1 6
Percentil 25 138 168 1 6
173 1 6
Total 15 10

Clase 2 Inga. Yendry Fernández Mora 27


EJERCICIO
Determine el rango intercuartil.

1,51 -0,12 0,35 -0,60 -0,85


0,56 -0,06 0,95 0,25 -1,04
Solución: -1,30 -0,43 -1,25 2,07 -0,50
-1,30 -1,25 -1,04 -0,85 -0,60 -0,50 -0,43 -0,12 -0,06 0,25 0,35 0,56 0,95 1,51 2,07
Percentil Resultado
25 -0,850
Posición Posición límite 4 Valor límite -0,850

Percentil Resultado
75 0,56
Posición Posición límite 12 Valor límite 0,56

Intercuartil 1,41

Clase 2 Inga. Yendry Fernández Mora 28


EJERCICIO
Se midió el grosor de 30 artículos seleccionados al azar de un lote de
producción, obteniéndose los siguientes datos (en cm)

1,29 1,28 1,21 1,27 1,20 1,22 1,24 1,25 1,23 1,30 1,22 1,26 1,25 1,23 1,21

1,28 1,26 1,29 1,27 1,30 1,26 1,21 1,21 1,22 1,22 1,28 1,28 1,29 1,30 1,27

 
Prepare una tabla de distribución de frecuencia de los resultados
obtenidos

Clase 2 Inga. Yendry Fernández Mora 29


Variable Frecuencias absolutas Frecuencias relativas
x Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

Determine las tres medidas de tendencia central vistas en clase


Media: Xm = [(1,20*1) + (1,21*4) + ....... + (1,29 * 3) + (1,30 * 3)] /30 = 1,253:
Mediana: La mediana de esta muestra es 1,26 cm, ya que por debajo está el 50% de
los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna de
frecuencias relativas acumuladas. En este ejemplo, como el valor 1,26 se repite en 3
ocasiones, la media se situaría exactamente entre el primer y el segundo valor de este
grupo, ya que entre estos dos valores se encuentra la división entre el 50% inferior y el
50% superior.
Moda:  Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo
tanto esta serie tiene 3 modas 30
No. de llantas Kilómetros No. de llantas Kilómetros
1 41250 9 38970
2 40187 10 40200
3 43175 11 42550
4 41010 12 41095
5 39265 13 40680
6 41872 14 43500
7 42654 15 39775
8 41287 16 40400

Calcule la media, moda, mediana, el rango, el percentil 77

Clase 2 Inga. Yendry Fernández Mora 31


Posición Dato Posición Dato
1 38970 9 41095
2 39265 10 41250
3 39775 11 41287
4 40187 12 41872
5 40200 13 42550
6 40400 14 42654
7 40680 15 43175
8 41010 16 43500
Media Mediana Rango Percentil 77
41116.875 41052.5 4530(77/100)*17
13.09
42559.36
32
MEDIDAS DE DISPERSIÓN
Muestra 1:   0, 45, 50, 55, 100 
Escala 0 10 20 30 40 50 60 70 80 90 100
x 0 45 50 55 100

Muestra 2:   47, 49.5, 50, 51.5, 52,


Escala 0 10 20 30 40 50 60 70 80 90 100
x 47 49,5 50 51,5 52 100

En ambos conjuntos, la media y mediana es igual a 50,


la diferencia está en la dispersión.

Clase 2 Inga. Yendry Fernández Mora 33


MEDIDAS DE DISPERSIÓN
La desviación media

Es el promedio de todas las diferencias


individuales de las observaciones respecto a la
media aritmética (promedio)

A mayor desviación, mayor dispersión con


respecto a su media.

A menor dispersión mayor homogeneidad

Clase 2 Inga. Yendry Fernández Mora 34


MEDIDAS DE DISPERSIÓN
La desviación estándar (desviación típica)
s: desviación muestral
u
: desviación poblacional

N x: desviación distribución
muestral
Con n-1 grados de libertad
El concepto de grados de libertad es
matemático y es el nombre dado al
número de observaciones linealmente
independientes que ocurren en una
n-1 suma de cuadrados.

Clase 2 Inga. Yendry Fernández Mora 35


MEDIDAS DE DISPERSIÓN
La desviación estándar (desviación típica)

u
Supongamos este
 ejemplo
N Al cuadrado

Al cuadrado
Al cuadrado

x1 x2 u xn

Clase 2 Inga. Yendry Fernández Mora 36


MEDIDAS DE DISPERSIÓN
La desviación estándar (desviación típica)
Muestreo simple al azar sin s: desviación muestral
reemplazo de una población
finita: : desviación poblacional
N= Tamaño de la población
2 = Variancia de la población x: desviación distribución
n = tamaño de la muestra muestral
Muestreo simple al azar con
x2= (N-n) * 2 reemplazo de una población
(N-1) n finita o simple al azar de una
población infinita
El factor (N-n)/ (N-1)
se denomina factor de
corrección para poblaciones
finitas x2=2/n
37
MEDIDAS DE DISPERSIÓN
Varianza (variancia) s2: varianza muestral
2: varianza poblacional
x2: varianza distribución
muestral
Propiedad:
La suma de los cuadrados de las desviaciones de
la totalidad de las observaciones, respecto de la
media aritmética de la distribución, es menor que
la suma de los cuadrados de las diferencias
respecto de cualquier otro valor que no sea la
media aritmética

Clase 2 Inga. Yendry Fernández Mora 38


MEDIDAS DE DISPERSIÓN
El coeficiente de variación
Se utiliza para comparar la dispersión de
variables que aparecen en unidades
diferentes (metros, kilos, etc.) o que
corresponden a poblaciones desiguales
A menor coeficiente de variación
la distribución de la variable es
muestral más homogénea


poblacional 

Clase 2 Inga. Yendry Fernández Mora 39


DATOS
AGRUPADOS
medidas de tendencia central,
posición, dispersión y forma
Distribución de frecuencias (conceptos)
Pasar de datos sin agrupar a datos agrupados

Límites de clase: Son los valores que definen una


clase separándola de la anterior y de la posterior.
Límites indicados: aparecen en la distribución.
Límites reales: señalan la verdadera extensión de la
clase.
Clases abiertas: se ubican al inicio o al final de la
distribución para incluir valores que se apartan
mucho de la mayoría. Querer incluirlos dentro de la
distribución con clases de igual amplitud obligaría a
tener clases intermedias vacías.

Ing. Marco González-Ingeniería Industrial-


28/03/16 Universidad de Costa Rica 41
Distribución de frecuencias
• Se acepta que el número de clases NO sea menor a 6 ni
mayor a 15, claro, que con excepciones.
• Es conveniente evitar clases de diferente amplitud y clases
abiertas.

Límites de clase: Son los valores que definen una clase


separándola de la anterior y de la posterior. Deben definir
clases:
Exhaustivas: que permitan clasificar a todas las
observaciones dentro de ellas (Es decir, deben abarcar
todos los datos de interés).
Mutuamente excluyentes: no permitan que una
observación quede incluida en más de una clase (Es
decir, cada dato debe pertenecer a una sola clase).

Clase 2 Inga. Yendry Fernández Mora 42


¿Cuántas clases utilizar y elegir los límites de cada
clase?
l k −l o
Tamaño de clase (c) = Rango / k c=
k
Donde k: Cantidad de clases
Conocido también
como: amplitud
Para determinar k: del intervalo o
intervalo de clase.
 Si n es ≤ 30, utilizar √n
Como sugerencia:
 Regla de Sturges: 1 + 3,322 log n 6 < k < 15

Clase 2 Inga. Yendry Fernández Mora 43


Vamos a utilizar CLASES
30 – 34 Peso de los
35- 39 estudiantes, es
40 – 44 una variable
continua!!
30 34 35 39 40 44

29,5 34,5 39,5 44,5

30 – 34 29,5 – 34,5
35- 39 34,5 – 39,5
40 – 44 39,5 – 44,5
Clase 2 Inga. Yendry Fernández Mora 44
EJEMPLO
Frecuencia Frecuencia
Límite Límite Frecuencia Frecuencia
Clase Absoluta Relativa
inferior superior Absoluta Relativa
Acumulada Acumulada
1 -0,25 1,85 10 10 20% 20%
2 1,85 3,95 13 23 26% 46%
3 3,95 6,05 19 42 38% 84%
4 6,05 8,15 6 48 12% 96%
5 8,15 10,25 2 50 4% 100%
50 100%
Recuerde:
El primer paso para construir la tabla de la
distribución de frecuencias es identificar el x menor y el
x mayor, luego ordenar y contar las fi
Las clases deben ser
Pertinentes La diferencia
entre el x mayor y el
Exhaustivas
x menor se conoce
Mutuamente
excluyentes
como Rango: R

Clase 2 Inga. Yendry Fernández Mora 46


Medidas de posición (tendencia central)
en datos agrupados.
MODA
Datos sin agrupar: Medida asociada al valor mas común,
más típico o más frecuente en un conjunto de datos.
En datos agrupados, se encuentra “la clase modal” que es

 
la clase con mayor densidad de frecuencias.
d1
M o  Li   IC
               
Li= límite inferior real de la clase modal.
d1  d 2
 d1= diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
anterior.
 d2= diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
posterior.
 IC =intervalo de clase modal

Probabilidad y Estadística I Clase 3 47


Moda, ejercicio:
Límite Límite
Clase inferior superior fi Fi fri Fri
1 -0,25 1,85 10 10 20% 20%
2 1,85 3,95 13 23 26% 46%
3 3,95 6,05 19 42 38% 84%

 
4 6,05 8,15 6 48 12% 96%
5 8,15 10,25 2 50 4% 100%
50 100%
              

6
M o =3,95+ ⋅(6,05−3,95 )=4,613
6+13
d1
M o  Li   IC
d1  d 2
Probabilidad y Estadística I Clase 3 48
Medidas de posición (tendencia central)
en datos agrupados.

LA MEDIANA
Datos sin agrupar: Es el valor central de
una serie de datos.
 
Datos agrupados: En            
una distribución
continua, el valor correspondiente a la
mediana divide el área bajo la curva en
dos partes iguales.

Probabilidad y Estadística I Clase 3 49


Medidas de posición (tendencia central)
en datos agrupados.
N
LA MEDIANA  Fa
M e  Li  2  IC
f

 
N = número total de observaciones o suma de las frecuencias
absolutas.
           
Li = límite inferior real de la clase donde está la mediana.
fi= frecuencia absoluta de la clase donde está la mediana.
Fa = frecuencia acumulada “menos de” de la clase anterior a la
clase donde está la mediana.
IC =intervalo de clase donde está la mediana.

Probabilidad y Estadística I Clase 3 50


Mediana, ejercicio:
Límite Límite
Clase inferior superior fi Fi fri Fri
1 -0,25 1,85 10 10 20% 20%
2 1,85 3,95 13 23 26% 46%

 
3 3,95 6,05 19 42 38% 84%
4 6,05 8,15 6 48 12% 96%
5 8,15 10,25 2 50 4% 100%
           
50 100%
N
1. Encuentro la posición  Fa
N/2 = 50/2 =25 M e  Li  2  IC
f
25−23
M e=3,95+ ⋅(6,05−3,95 )=4,171
19 Probabilidad y Estadística I Clase 3
51
Medidas de posición (tendencia central)
en datos agrupados.
k k

fx fx i i i i

 MEDIA
x i 1
k
 i 1
n
 Datos sin agrupar: promedio simple. f i 1
i

 
 En una distribución de frecuencias se         
conoce el número de observaciones
que hay dentro de una clase, pero no se sabe el valor exacto de cada una
de ellas.

 Hipótesis: se supone que las observaciones dentro de una clase se


distribuyen uniformemente y por eso es que el PUNTO MEDIO las
representa adecuadamente. Es lo mismo que decir, que todas son iguales
al punto medio.

Probabilidad y Estadística I Clase 3 52


Medidas de posición (tendencia central)
en datos agrupados.
MEDIA

1. Se utiliza el punto medio de cada intervalo para representar


todas las calificaciones dentro de ese intervalo.

1. El punto medio se multiplica por su frecuencia


correspondiente.

1. Se suma este producto

1. Se divide entre N.

Probabilidad y Estadística I Clase 3 53


Límite Límite
Clase inferior superior fi Fi fri Fri
1 -0,25 1,85 10 10 20% 20%
2 1,85 3,95 13 23 26% 46%
3 3,95 6,05 19 42 38% 84%
4 6,05 8,15 6 48 12% 96%
5 8,15 10,25            2
50
50 4%
100%
100%

Límite Límite Punto Punto


Clase inferior superior fi Fi fri Fri medio medio *f
1 -0,25 1,85 10 10 20% 20% 0,80 8,0
2 1,85 3,95 13 23 26% 46% 2,90 37,7
3 3,95 6,05 19 42 38% 84% 5,00 95,0
4 6,05 8,15 6 48 12% 96% 7,10 42,6
5 8,15 10,25 2 50 4% 100% 9,20 18,4
50 100% 201,7

201,7/50 = 4,034
Probabilidad y Estadística I Clase 3 54
Medidas de posición (tendencia central)
en datos agrupados.
PERCENTILES

Recordemos: se obtienen valores que dividen


el conjunto ordenado de datos en fracciones
específicas.

Probabilidad y Estadística I Clase 3 55


Medidas de posición (tendencia central)
en datos agrupados.
 PERCENTILES
m
 n  Fa
Pm  Li  100  IC
f

 Pm= percentil m, donde 1≤ m ≤ 99


 n = número total de observaciones o suma de las frecuencias absolutas.
 Li = límite inferior real de la clase donde está el percentil m.
 fi= frecuencia absoluta de la clase donde está el percentil m.
 Fa = frecuencia acumulada “menos de” de la clase anterior a la clase donde
está el percentil m.
 IC =intervalo de clase donde está el percentil m.

Probabilidad y Estadística I Clase 3 56


Límite Límite
Clase inferior superior fi Fi fri Fri
Obtenga
1 -0,25 1,85 10 10 20% 20%
el
2 1,85 3,95 13 23 26% 46%
percentil 3 3,95 6,05 19 42 38% 84%
30: 4 6,05 8,15 6 48 12% 96%
Posición= 5 8,15 10,25 2 50 4% 100%
(m/100)*n=
(30/100)*50=
          50 100%

15
m
 n  Fa
Pm  Li  100  IC
f
15−10
Pm=1,85+ ⋅(3,95−1,85)=2,658
13
Probabilidad y Estadística I Clase 3 57
DESVIACIÓN ESTÁNDAR
Para datos agrupados

       

xi = punto medio de la clase


fi = frecuencia absoluta de la clase

Probabilidad y Estadística I Clase 3 58


MEDIDAS
FORMA

•Histogramas
•Polígonos de frecuencia
•Ojivas
•Gráficos de caja
•Curtosis
Curtosis
Caracteriza el grado de elevación o achatamiento de una distribución
comparada con la distribución normal.
LEPTOCÚRTICA: k>0 Más “picuda” que la normal (pico).
PLATICÚRTICA: k<0 Más chata que la normal.
MESOCÚRTICA: K=0 Igual que la normal.
Es una razón de la amplitud semintercuartil, es decir, la mitad del
valor de la amplitud intercuartil y la amplitud 90-10 percentil.
k= ( 1 / 2 ( x . 75 − x . 25 ))/ ( x . 90 − x . 10 )

Clase 3 Probabilidad y Estadística I 60


Histograma de frecuencias
Las barras no guardan separación entre
sí, se marcan los límites reales de todas
las clases. La escala no necesita
comenzar en cero, pero si un intervalo
de clase antes del límite inferior de la
clase más baja.

Clase 2 Inga. Yendry Fernández Mora 61


Histograma.
En el eje horizontal se
representan los intervalos
de los datos, marcándose
de manera continua las
fronteras entre cada uno
de estos. La altura
corresponde a la frecuencia
de cada intervalo

I semestre 08 62
Histograma.
 Las características geométricas del histograma
nos permiten descubrir información útil sobre
los datos, por ejemplo:
1. La localización del “centro” de los datos.
2. El grado de dispersión.
3. La sección a la cual se sesga, es decir, cuando
no cae simétricamente en ambos lados del
pico.
4. El grado de agudeza del pico. Cómo se levanta
y baja la pendiente

I semestre 08 Prof. Patricia Ramírez B. 63


Polígono de frecuencias
Consiste en una serie de puntos trazados en las
intersecciones de las marcas de clase y las frecuencias de
cada una, uniéndose consecutivamente con líneas. Se
añaden dos clases con frecuencias cero: una antes de la
primera clase con datos y otra después de la última. El
resultado es que se "sujeta" la línea por ambos extremos
al eje horizontal y lo que podría ser una línea separada
del eje se convierte, junto con éste, en un polígono.

I semestre 08 Prof. Patricia Ramírez B. 64


Ojiva
Mayor
que Distribución
acumulativa

Menor que
porcentual
Menor
que

I semestre 08 Prof. Patricia Ramírez B. 65


La práctica hace al
maestro ....
Así que a practicar!!
Sean los datos
de 40 muestras 29 30 32 34 29 31 30 35 39 33
que miden el
espesor de las
asas de latas 29 34 35 40 34 35 30 35 33 31
de pintura.
Determine, de
los datos sin 34 30 35 34 37 28 34 39 31 38
agrupar, el
rango
intercuartil y la 35 28 38 36 29 36 35 28 37 37
desviación
típica
67
Percentil Resultado
75 35,75
Posición Posición límite 30 Valor límite 35,000
Posición a Valor a
30,75 interpolar 0,75 interpolar 36,000
Interpolación 0,75

Percentil Resultado
25 30,000
Posición Posición límite 10 Valor límite 30,000
Posición a Valor a
10,25 interpolar 0,25 interpolar 30,000
Interpolación 0,00

Intercuartil 5,75

Desviación
estándar
MUESTR
AL 3,404

Clase 2 Inga. Yendry Fernández Mora 68


Dos profesores que imparten diferentes materias a un
mismo grupo deciden comparar los resultados en una y otra
materia, para lo cual obtienen :
Materia A: media= 6.3 desviación típica = 1.2
Materia B: media= 8 varianza = 9
¿A qué conclusión se puede llegar?
Tratándose de comparaciones, es apropiado utilizar el
coeficiente de variación
cvA= 1.2/6.3 = 0.190

cvB= 3/8 = 0.375


Luego ....¿?
69
Montemos entonces la tabla de
frecuencias…
 Construya la tabla de frecuencias para los siguientes datos
(Toneladas de maíz cosechadas en un campo experimental):
2,73 2,84 2,13 0,89
1,62 1,46 2,06 2,17
2,58 0,57 2,03
1,62 1,65 1,34
2,21 1,82 0,96
2,05 1,36 1,37
1,33 1,46 0,45
2,39 0,75 1,21
1,97 2,21 0,69
1,69 1,27 0,96
Clase 2 Inga. Yendry Fernández Mora 70
Clase 2 Inga. Yendry Fernández Mora 71

También podría gustarte