Está en la página 1de 49

DATOS

CUA N TITATIVOS
SIMPLES Y
AGRUPADOS.
DISTRIBUCIÓN DE FRECUENCIAS SIMPLES

 Esta nos indica la frecuencia con que aparecen los números, desde el menor del
conjunto hasta el mayor o viceversa.
 Cuando la muestra es menor a 30 o el rango de los valores observados de la variable
de interés es pequeño.
DISTRIBUCIÓN DE FRECUENCIAS SIMPLES

0.01 0.02 0.01 0.03 0.04 0.01 0.01


0.02 0.03 0.04 0.04 0.05 0.02 0.02
Distribución de frecuencia simple, ya que el
0.01 0.01 0.03 0.03 0.02 0.01 0.02 rango es pequeño.
0.01 0.03 0.04 0.05 0.03 0.02 0.02
0.02 0.01 0.04 0.02 0.03 0.03 0.02

0.001 0.022 0.011 0.019 0.024 0.009 0.025


0.023 0.013 0.042 0.044 0.015 0.012 0.076
Distribución de frecuencias agrupadas, ya que
0.021 0.012 0.033 0.028 0.020 0.088 0.066
el rango es grande.
0.005 0.031 0.054 0.051 0.024 0.097 0.019
0.002 0.021 0.022 0.075 0.012 0.003 0.015
GRÁFICO DE PUNTOS

 Muestra pequeños conjunto de datos cuantitativos.


 Eje horizontal: valores de la variable estudiada.

 Eje vertical: la frecuencia de aparición de un valor en el conjunto de datos estudiados.


GRÁFICO DE BARRAS ESTRECHAS
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS SIMPLES

Medida Símbolo (muestra) Símbolo (población)


Media aritmética 𝑋ത µ
Mediana Me Me
Moda Mo Mo
MEDIA ARITMÉTICA

• Medida de posición que proporciona una descripción compacta de cómo


están centrados los datos
• Todo conjunto de datos medido en escala de intervalo o razón tiene
media.
• Es sensible a los valores extremos.

σ 𝑋𝑖 𝑓
𝑋ത =
𝑛
MEDIANA

• Valor de la observación que ocupa la posición central de un conjunto de datos


ordenados según su magnitud.
• Es un valor que deja por debajo de él un número de casos igual al que deja por
arriba.
• No presenta el problema de estar influida por los valores extremos, pero no utiliza
en su cálculo todos los valores de la serie de datos.
𝑛+1 Posición
• 𝐷𝑎𝑡𝑜𝑠 𝑠𝑖𝑚𝑝𝑙𝑒𝑠: 𝑀𝑒 =
2
M O DA:

• La moda es el valor que tiene mayor frecuencia absoluta. Se puede hallar la


moda para variables cualitativas y cuantitativas. Si en un grupo hay dos o varias
puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la
distribución es bimodal o multimodal, es decir, tiene varias modas.
• Es la única que se puede calcular para cualquier escala de medición.
• 𝐷𝑎𝑡𝑜𝑠 𝑠𝑖𝑚𝑝𝑙𝑒𝑠: 𝑀 𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑞𝑢𝑒 𝑚á𝑠 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒
COMPARACIÓN ENTRE MEDIA, MEDIANA Y MODA.

La media es la medida más común de tendencia central. Desafortunadamente, la media se ve


afectada por valores extremos, o valores atípicos, y a diferencia de la mediana, puede ser
sesgada por las observaciones que están muy por encima o muy por debajo de ésta.

La moda también es menos afectada por los valores atípicos, pero si no hay moda o si el
conjunto de datos es bimodal su uso puede ser confuso.

La medida que se seleccione depende de la naturaleza de los datos o de la forma en como se


utilicen los datos.
MEDIDAS DE TENDENCIA N O CENTRAL (FRACTILOS)

Medidas de Posición (fractilos o cuantilos)


• Los fractilos permiten identificar valores ubicados en diferentes
posiciones. Se denomina fractilo a la localización del valor que
corresponde al final de cada parte en que se ha dividido la
distribución de los datos.
• Cuartiles
• Deciles
• Centiles o Percentiles
FRACTILOS

 Cuartiles
𝑖
 𝑄𝑖 = 𝑛 𝑑𝑜𝑛𝑑𝑒: 𝑖 = 1,2,3,4
4
 Deciles
𝑖
 𝐷𝑖 = 𝑛 𝑑𝑜𝑛𝑑𝑒: 𝑖 = 1,2,3,4,5,6,7,8,9,10
10
 Centiles o Percentiles
𝑖
 𝑃𝑖 = 𝑛 𝑑𝑜𝑛𝑑𝑒: 𝑖 = 1,2,3,4 … 100
100
CUARTILES

 Cuartiles
𝑖
 𝑄𝑖 = 𝑛 𝑑𝑜𝑛𝑑𝑒: 𝑖 = 1,2,3,4
4
 𝑄1 = 25%
 𝑄2 = 50%
 𝑄3 = 75%
 𝑄4 = 100%
DECILES

𝑖
 𝐷𝑖 = 𝑛 𝑑𝑜𝑛𝑑𝑒: 𝑖 = 1,2,3,4,5,6,7,8,9,10
10

 𝐷1 = 10%
 𝐷2 = 20%
 𝐷3 = 30%
 𝐷4 = 40%
 𝐷5 = 50%
 𝐷6 = 60% …
 𝐷10 = 100%
CENTILES O PERCENTILES

 Centiles o Percentiles
𝑖
 𝑃𝑖 = 𝑛 𝑑𝑜𝑛𝑑𝑒: 𝑖 = 1,2,3,4 … 100
100
 𝑃5 = 5%
 𝑃10 = 10%
 𝑃18 = 18%
 𝑃25 = 25%
 𝑷𝟓𝟎 = 𝟓𝟎% = 𝑸𝟐 = 𝑫𝟓 = 𝑴𝒆
 𝑃65 = 65%
 𝑃75 = 75%
 𝑃95 = 95%
EJEMPLO 3: DATOS SIMPLES

 50 familias registran el número de sus hijos mediante la siguiente tabla:

2 4 2 3 1 2 4 2 3 0
2 2 3 2 6 2 3 2 2 3
2 3 3 4 1 3 3 4 5 2
0 3 2 1 2 3 2 2 3 1
4 2 3 2 4 3 3 2 2 1
REALICE:

 Tabla de distribución de frecuencias.


 Gráfico
 Medidas de tendencia central
 Fractilos P25, P45 y P90
EJEMPLO 4: DATOS CUANTITATIVOS SIMPLES

A continuación se presenta la nota de la


primera comprobación de un grupo del
1 3 5 2 2 curso de Estadística 1. Nota máxima 5
puntos
5 4 3 2 1 Ordene la información proporcionada en
el cuadro de frecuencias.
4 5 5 0 1
Realice un gráfico
3 2 2 4 4 Realice algunas conclusiones.
Calcule las tres medidas de tendencia
5 5 3 1 2 central.
4 4 2 3 0 Calcule los tres cuartiles.
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

Frecuencia Frecuencia
frecuencia Frecuencia Frecuencia Frecuencia
Notas relativa acumulada
absoluta acumulada relativa porcentual
acumulada porcentual
0 2 2 0.07 0.07 7% 7%
1 4 6 0.13 0.20 13% 20%
2 7 13 0.23 0.43 23% 43%
3 5 18 0.17 0.60 17% 60%
4 6 24 0.20 0.80 20% 80%
5 6 30 0.20 1.00 20% 100%
Total 30 1 100%
Notas de la primera comprobación
8
7
7
6 6
6
Número de estudiantes

5
5
4 GRÁFICO
4
BARRAS VERTICAL
3
2 (ESTRECHO)
2

0
0 1 2 3 4 5
Nota sobre 5 puntos

Fuente:propia
GRÁFICA DE PUNTOS

Muestra pequeña conjunto de datos


cuantitativos.
Eje horizontal: valores de la variable
estudiada.
Eje vertical: la frecuencia de aparición
de un valor en el conjunto de datos
estudiados.
CONCLUSIONES

El 60% de los estudiantes tienen una nota máxima de 3 puntos.


El 7% de los estudiantes tiene una nota de 0 puntos (2 de 30 estudiantes).
El 20% de los estudiantes tienen una nota de 5 puntos.
El 40% de los estudiantes tienen una nota mínima de 4 puntos.
La probabilidad que se seleccione un alumno al azar que tenga una nota de 2 puntos
es de 0,23.
CÁLCULOS
σ 𝑥𝑖 𝑓 0 2 + 1 4 + 2 7 + 3 5 + 4 6 + 5(6) 87
Media aritmética 𝑥ҧ = = = = 2,9 𝑝𝑢𝑛𝑡𝑜𝑠 (𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜)
σ𝑓 30 30
Mediana 𝑀 𝑒 = 𝑛+1 = 30+1
15,5 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛
2 2
Se busca entre la base de datos (ordenar)

0 0 1 1 1 1 2 2 2 2
2 2 2 3 3 3 3 3 4 4
4 4 4 4 5 5 5 5 5 5
3+3
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = = 3 𝑝𝑢𝑛𝑡𝑜𝑠 (𝑒𝑙50% 𝑑𝑒 𝑙𝑜𝑠𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑒𝑠𝑡á𝑛 𝑝𝑜𝑟 𝑑𝑒𝑏𝑎𝑗𝑜 𝑑𝑒 3 𝑝𝑢𝑛𝑡𝑜𝑠)
2

Moda 𝑴 𝒐 = 𝟐 𝒑𝒖𝒏𝒕𝒐𝒔 (𝒍𝒂 𝒏𝒐𝒕𝒂 𝒐𝒃𝒔𝒆𝒓𝒗𝒂𝒅𝒂 𝒄𝒐𝒏 𝒎 𝒂 𝒚 𝒐 𝒓 𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒆𝒔 𝒅𝒆 𝟐


𝒑𝒖𝒏𝒕𝒐𝒔)
CÁLCULO DE FRACTILOS

25
𝑄1 = 𝑃 25 = 30 = 7,5 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑄 1 = 𝑃25 = 2 𝑝𝑢𝑛𝑡𝑜𝑠
100
50
𝑄2 = 𝑃 50 = 30 = 15 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑄 2 = 𝑃50 = 3𝑝𝑢𝑛𝑡𝑜𝑠
100
75
𝑄3 = 𝑃 75 = 30 = 22,5 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑄 3 = 𝑃75 = 4 𝑝𝑢𝑛𝑡𝑜s
100
EJEMPLO 5:

 Datos simples
 Se tienen algunas características de un grupo de 12 personas. Estas
características son:
 Edad (años): 22,24,25,26,27,28,28,29,30,31,33,34
 Ingreso anual: 8000-8200-9000-10 000-11 000-12 000-12 300-12 500-13 000-
13 500-86 000-97 000
 Número de zapato: 8 ½-9- 9 ½ - 9 ½ - 9 ½ 9 ½ -10-10-10 ½-10 ½ -11-11 ½
 ¿Cuál es la edad promedio, ingreso anual promedio y número de zapato
promedio para este grupo?
Edad Ingreso Anual Número de zapato
SOLUCIÓN 1 22 8000 8.5
2 24 8200 9
3 25 9000 9.5
4 26 10000 9.5
5 27 11000 9.5
6 28 12000 9.5
7 28 12300 10
 La medida de tendencia 8 29 12500 10
9 30 13000 10.5
central debe 10 31 13500 10.5
representar a los datos. 11 33 86000 11
12 34 97000 11.5
Media 28 24375 9.916666667
Mediana 28 12150 9.75
Moda 28 #N/D 9.5
DATOS CUANTITATIVOS CONTINUOS
DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS O DE VALORES
AGRUPADOS.

 Ordenar los datos de menor a mayor o viceversa.


 Calcular el rango o recorrido. R=Xmax-Xmin
 Determinar el número de clases: k=1+3.3log(n) fórmula de Sturges
 Determinar el intervalo de clase i=R/k
 Formar los intervalos (límites aparentes).
 Formar los límites reales.
 Determinar las frecuencias de clase contando el número de observaciones
 Determinar marca de clase: media de los intervalos.
MEDIDAS DE TENDENCIA CENTRAL (DATOS AGRUPADOS)

σ 𝑋𝑖 ∗𝑓
𝑋 =
σ𝑓
𝑛
−𝐹
2
 𝐷𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠: 𝑀𝑒 = 𝐿𝑚𝑒 + ∗𝐴
𝑓𝑚𝑒

𝐷1
 𝐷𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠: 𝑀𝑜 = 𝐿𝑚𝑜 + ∗𝐴
𝐷1 +𝐷2
MEDIDA DE TENDENCIA NO CENTRAL (FRACTILOS)

𝑝
∗σ 𝑓−𝐹
Agrupados 𝑃𝑖 = 𝐿𝑝𝑖 + 100
∗𝐴
𝑓𝑝𝑖

𝑝
Paso 1: aplicar la fórmula ∗ σ𝑓
100
Paso 2: buscar en F acumuladas el valor obtenido en el paso 1, el que
contenga ese valor.
Paso 3: sustituir
EJEMPLO 6
 Siguiente conjunto de datos obtenidos en la
determinación del tiempo (minutos) que un cliente
12 14 9 10 8 26 27 14 13 14 se mantuvo en la fila antes de ser atendido en una
3 5 10 8 7 7 6 13 12 21
sucursal bancaria de la localidad.

25 27 11 7 12 12 13 19 18 17 • Ordene la información proporcionada en el cuadro


28 30 4 21 15 15 16 21 20 14
de frecuencias.
• Realice un histograma, polígono de frecuencia y
14 16 12 18 21 8 9 10 9 9
ojiva
7 9 18 32 20 4 5 8 7 18
• Realice algunas conclusiones.
6 8 25 11 16 31 24 26 25 26
• Calcule las tres medidas de tendencia central.
4 6 22 12 14 22 23 31 30 12 • Calcule el P25 , P50 , P70 y P90.
EJEMPLO 7
Los siguientes datos son los lapsos, en minutos, necesarios para que 50 clientes de un
banco comercial, lleven a cabo una transacción bancaria. Realice una tabla de
distribución de frecuencias.
Calcule las tres medidas de tendencia central
Calcule el 𝑃25 , 𝑃50 , 𝑃60 , 𝑃90

0.2 0.5 1.2 1.4 2.3 2.8 3.3 4.4 5.6 7.2
0.4 0.7 1.2 1.5 2.4 2.8 3.4 4.6 5.8 7.6
0.4 0.8 1.3 1.6 2.4 2.9 3.7 4.7 6.2 7.8
0.4 0.9 1.3 1.8 2.5 3.1 3.8 5.2 6.3 9.5
0.5 1.1 1.4 1.9 2.7 3.3 4.2 5.5 6.8 9.7
TABULACIÓN DE DATOS

Cálculo de intervalos
Número de datos 50
Valor máximo 9.7
Valor mínimo 0.2
Rango (R) 9.5
Número de intervalos (k) 6.606601 6 o 7 clases
Amplitud (A) 1.4380 1.4
Se aproxima a un decimal, ya que
la base de datos es de un decimal.
Regla de Sturges
1+3.3log(n)
Límites aparentes Límites reales
Lai Las Lri Lrs f Fa Xi fr Fr f% F%
0.2 1.5 0.15 1.55 17 17 0.85 0.34 0.34 34 34
1.6 2.9 1.55 2.95 11 28 2.25 0.22 0.56 22 56
3.0 4.3 2.95 4.35 7 35 3.65 0.14 0.70 14 70
4.4 5.7 4.35 5.75 6 41 5.05 0.12 0.82 12 82
5.8 7.1 5.75 7.15 4 45 6.45 0.08 0.90 8 90
7.2 8.5 7.15 8.55 3 48 7.85 0.06 0.96 6 96
8.6 9.9 8.55 9.95 2 50 9.25 0.04 1.00 4 100
50 1 100
La±0,05
Lai-0,1
Marca de clase:
Ya que los datos promedio de los
tiene un decimal. límites reales o
aparentes.

TABLA DE FRECUENCIAS
MEDIDAS DE TENDENCIA CENTRAL (DATOS AGRUPADOS)

σ 𝑋𝑖 ∗𝑓
𝑋 =
σ𝑓
𝑛
−𝐹
2
 𝐷𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠: 𝑀𝑒 = 𝐿𝑚𝑒 + ∗𝐴
𝑓𝑚𝑒

𝐷1
 𝐷𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠: 𝑀𝑜 = 𝐿𝑚𝑜 + ∗𝐴
𝐷1 +𝐷2
MEDIA ARITMÉTICA

σ 𝑥ⅈ ∗ 𝑓𝑖
𝑥ҧ =
𝑛

0,85 17 + 2,25 11 + 3,65 7 + 5,05 6 + 6,45 4 + 7,85 3 + 9,25(2)


𝑥ҧ = = 𝟑, 𝟐𝟔 𝒎𝒊𝒏𝒖𝒕𝒐𝒔
50
MEDIANA
𝑛
2 −𝐹
𝑀𝑒 = 𝐿𝑚𝑒 + ∗𝐴
𝑓𝑚𝑒

𝑛 50
= = 25 (𝐵𝑢𝑠𝑐𝑎𝑟 𝑒𝑛 𝐹𝑎
2 2
25−17
𝑀𝑒 = 1,55 + ∗ 1,4 = 2,57 𝑚𝑖𝑛
11
El tiempo máximo del 50% de la muestra (25 clientes) es de 2,57 min.
MODA

𝐷1
𝑀𝑜 = 𝐿𝑚𝑜 + ∗𝐴
𝐷1 + 𝐷2

Buscar la de mayor frecuencia absoluta


𝐷1 = 17 − 0 = 17
𝐷2 = 17 − 11 = 6
17
𝑀𝑜 = 0,15 + ∗ 1,4 = 1,18 𝑚𝑖𝑛
17 + 6
MEDIDA DE TENDENCIA NO CENTRAL (FRACTILOS)

𝑝
∗σ 𝑓−𝐹
Agrupados 𝑃𝑖 = 𝐿𝑝𝑖 + 100
∗𝐴
𝑓𝑝𝑖

𝑝
Paso 1: aplicar la fórmula ∗ σ𝑓
100
Paso 2: buscar en F acumuladas el valor obtenido en el paso 1, el que
contenga ese valor.
Paso 3: sustituir
PERCENTILES

12,5 − 0
𝑃25 = 0,15 + ∗ 1,4 = 1,18 𝑚𝑖𝑛
17
𝑃25 = 𝑀𝑒 = 2,57 mⅈn
30 − 28
𝑃60 = 2,95 + ∗ 1,4 = 3,35 𝑚𝑖𝑛
7
45 − 41
𝑃90 = 5,75 + ∗ 1,4 = 7,15 𝑚𝑖𝑛
4
EJEMPLO 8

 La siguiente tabla muestra las cantidades (en


quetzales) que representan el gasto en gasolina
de 32 automóviles de diferentes marcas, durante
un recorrido de 200 km en una ciudad.
 Determine:
• La cantidad media en quetzales de gasto de
gasolina de los 32 automóviles.
• La cantidad en quetzales del 15% de la muestra
que gastaron menos gasolina.
• La cantidad en quetzales del 75% de la muestra
que gastaron más gasolina.
• ¿Qué porcentaje de automóviles gastó Q. 36,00
o menos en el recorrido de 200 km?
GRÁFICOS
HISTOGRAMA

 Eje horizontal: intervalos de clase (límites reales)


 Eje vertical: frecuencias
 Rectángulos unidos cuyos anchos son los de los intervalos de clase.
 Variables cuantitativas.
 Datos agrupados
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS:
Histograma y polígono de frecuencias
Tiempo de transacción bancaria
18 17
número de clientes

16

14

12 11

10

8 7
6
6
4
4 3
2
2
0 0
0

0-0.15 0.15-1.55 1.55-2.95 2.95-4.35 4.35-5.75 5.75-7.15 7.15-8.55 8.55-9.95 9.95-11.25


Tiempo de transacción (min)
POLÍGONO DE FRECUENCIAS

 Es un gráfico de líneas trazado sobre las marcas de clase.


 El polígono empieza y termina en el eje horizontal.
POLÍGONO DE FRECUENCIAS
Polígono de frecuencias
Tiempo por transacción bancaria
18
17
fi Xi 16

17 0.85 14
Número de clientes

11 2.25 12
11
7 3.65 10

6 5.05 8
7
4 6.45 6 6
3 7.85 4 4
3
2 9.25
2 2
0 0 0
0.85 2.25 3.65 5.05 6.45 7.85 9.25
Tiempo promedio por transacción (min) Marcas de clase
FRECUENCIAS ACUMULADAS U OJIVA

 Eje horizontal: límites reales superiores


 Eje vertical: frecuencia acumulada
 Para el límite inferior de la primera clase la frecuencia acumulada es cero
y para el límite superior de la última clase es igual al total de datos.
OJIVA ASCENDENTE

Ojiva ascendente (menor que)


Tiempo por transacción bancaria
Límites reales Fa
0.15 0 50
48
No. de clientes

1.55 17 45
41
2.95 28
35
4.35 35
28
5.75 41
7.15 45 17
8.55 48
9.95 50
0
0.15 1.55 2.95 4.35 5.75 7.15 8.55 9.95
Tíempo de transacción (min)
OJIVA DESCENDENTE
Ojiva descendente (mayor que)
Tiempo por transacción bancaria
60
Límites reales Fa
0.15 50 50 50
1.55 33
No. de clientes

40
2.95 22
30
33
4.35 15
5.75 9 20 22
7.15 5 15
10 9
8.55 2
5
9.95 0 0 2 0
0.15 1.55 2.95 4.35 5.75 7.15 8.55 9.95
Tiempo de transacción (min)

También podría gustarte