Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE
ESTADISTICA
Sobre estadística se presentan diversos conceptos; por tal razón les presento los siguientes
conceptos sobre estadística:
División de la estadística
La estadística fue utilizada por los Egipcios para analizar los datos de la población, la renta
(Aproximadamente siglo XXXII A. de C). En el antiguo testamento, primera parte de la Biblia,
se encuentran los libros de “Números” y “Crónicas”, donde se pueden observar algunos
registros estadísticos.
Se registros de que el Imperio romano fue el primero en recopilar gran cantidad de datos sobre
la población, superficie y la renta de todos las comarcas bajo su dominio.
Para hablar sobre el desarrollo de la estadística, hay que destacar los aportes de grandes
personalidades de la ciencia. A continuación se presentan algunas de estas grandes
personalidades:
Karl Pearson (1857-1936): En 1905 publicó un artículo titulado Sobre la teoría general de la
asimetría, la correlación y la regresión no lineal. Algunas contribuciones de K. Pearson a la
Teoría de la Probabilidad y a la Inferencia Estadística son:
• Introduce su familia de curvas y ajusta sus parámetros, introduciendo el método de los
momentos. Esta familia de curvas son las soluciones de una ecuación diferencial e
incluye a las distribuciones, Beta asimétrica, la Beta simétrica, la Gamma y la Normal,
entre otras.
• Define el coeficiente de correlación lineal precisando las ideas introducidas por Galton.
• Desarrolla el método de la 𝑥 2 de Pearson para medir el ajuste entre unos datos y una
distribución de probabilidad, y lo generaliza a las tablas de contingencia
William Sealy Gosset (STUDENT), (1876-1937): Publica trabajos sobre control de calidad,
la ley de errores, la distribución de los errores.
Algunas contribuciones de (Student) William Sealy Gosset son:
• La demostración de la convergencia de la distribución binomial a la distribución de
Poisson.
• Estableciendo su distribución, donde X es la media muestral y S2, la cuasivarianza
muestral.
• Introdujo la función de potencia de un contraste dado por la región crítica.
En las ciencias médicas: Se utiliza para diversas actividades de la medicina, entre las que
se encuentran:
• Diagnóstico de enfermedades y de la salud de la comunidad.
• Predicción del resultado probable de un programa de intervención.
• Elección apropiada de intervención en pacientes.
• Administración sanitaria y planificación.
Para lograr cierto dominio de del lenguaje técnico de la estadística, es recomendable conocer
las definiciones de diferentes términos empleados en la estadística, entre los que están:
Elemento: Se refiere a las personas u objetos que incluyen las informaciones objetos de
estudio.
Estadísticos: Son medidas numéricas que describen las características de una muestra.
Parámetros: Son medidas numéricas que describen las características de una población.
Ejemplo:
a. La marca de un vehículo.
b. El color de una laptop.
• Variables continuas, que pueden tomar cualquier valor dentro del conjunto de los
números reales R o de un intervalo suyo. Ejemplos de variables continuas son las
medidas antropomórficas de los recién nacidos, la altura de los ciudadanos de un
determinado colectivo, la medición de temperaturas, etcétera.
Ejercicios:
Los elementos o individuos que componen un estadístico pueden estar contenidos una varias
veces de manera repetida. En tal sentido, una población o una muestra puede contener “m”
elementos agrupados según su caracterización “n” clases diferentes.
Cada uno de los elementos de un estadístico, son resumidos mediante el uso de las tablas
estadísticas.
La tabla estadística lleva consigo las siguientes magnitudes estadísticas:
• Frecuencia absoluta simple (fi): registra la frecuencia o el número de veces que se
repite un elemento.
• Frecuencia absoluta acumulada (Fr): Se determina sumando las frecuencias
absolutas anteriores, hasta la frecuencia del nivel correspondiente.
• Frecuencia relativa (fi): Se calcula Dividiendo la frecuencia absoluta simple del
elemento de interés, entre la muestra (o la población en estudio).
𝒇𝒊
𝒇𝒓 =
𝒏
𝑭𝒓 % = f𝑟 %
10
Importante es observar, que sea muestra o población con la que estemos trabajando, siempre
será igual a la sumatoria de las frecuencias absolutas.
𝒏 = ∑ 𝒇𝒊
Una tabla estadística puede estar constituida por datos cuantitativos o por datos cualitativos.
Para construir una tabla de distribución de frecuencias debemos tomar en cuenta la naturaleza
de los datos a tratar; es decir, que debemos considerar si los datos son cualitativos o son
cuantitativos.
En el caso que los datos sean cuantitativos, tendremos la alternativa de construir una tabla de
datos no agrupados o una tabla de datos agrupados.
11
Luego agregamos las tres siguientes columnas siguientes, las cuales corresponden a:
• Frecuencia absoluta acumulada.
• Frecuencia relativa.
• Frecuencia relativa acumulada.
Cuando los datos son cuantitativos, se pueden construir dos tipos de tabla:
• Tabla con datos no agrupados,
• Tabla con datos agrupados,
Ejemplo:
Vamos a construir la tabla de frecuencias con los siguientes datos cuantitativos:
4, 4, 6, 6, 6, 6, 8, 8, 8, 8, 8, 12, 12, 12, 14, 14
12
a) Determinación del Rango (R): Está dado por la diferencia entre el valor máximo y el valor
mínimo de los datos estadísticos.
Identificamos el valor mínimo que es el menor valor registrado entre los datos estadísticos
(Vm).
Identificamos el valor máximo que es el mayor valor registrado entre los datos estadísticos
(VM).
𝑹 = 𝑽𝑴 − 𝑽𝒎
13
𝒌 = 𝟏 + 𝟑. 𝟑𝟐 × 𝒍𝒐𝒈(𝒏)
𝒌 = √𝒏
𝑹
𝒂𝒊 =
𝒌
14
Datos organizados:
30 30 32 32 35 35 35 35 36 37
38 39 39 40 45 45 47 47 47 48
48 49 50 50 50 52 54 55 55 56
56 56 58 58 58 58 58 60 60 65
Valor mínimo: Vm = 30
Valor máximo: VM = 65
Determinando el rango:
a) 𝑅 = 𝑉𝑀 − 𝑉𝑚 = 65 − 30 = 35
b) 𝑅 = 35
𝑘 = √𝑛 = √40 = 6.32 ≅ 6
Determinando la amplitud
𝑅 35
a) 𝑎𝑖 = 𝑘
= 6
= 5.83 ≅ 6
b) 𝑎𝑖 = 6
15
• En la primera clase contamos la cantidad de datos desde 30 hasta 36, excluyendo el 36.
• En la segunda clase contamos la cantidad de datos desde 36 hasta 42, excluyendo el 42.
• En la tercera clase contamos la cantidad de datos desde 42 hasta 48, excluyendo el 48.
• En la cuarta clase contamos la cantidad de datos desde 48 hasta 54, excluyendo el 54.
• En la quinta clase contamos la cantidad de datos desde 54 hasta 60, excluyendo el 60.
• En la sexta clase contamos la cantidad de datos desde 60 hasta 66, excluyendo el 66.
Las siguientes columnas han sido trabajadas anteriormente: Desde La columna C2 hasta C4.
La columna identificada como C5, corresponde a la amplitud, la cual fue determinada.
La columna identificada como C6, corresponde a la marca de la clase o punto medio de la
clase, que se determina a través de la semisuma de los límites de cada clase.
𝑳𝒊−𝟏 + 𝑳𝒊
𝒙𝒊 =
𝟐
𝟑𝟎 + 𝟑𝟔 𝟔𝟔
Primera clase: 𝒙𝒊 = = = 𝟑𝟑
𝟐 𝟐
De esa forma se continúa con las clases siguientes.
16
Diagrama de barras:
El diagrama de barras, como su nombre lo indica, está formado por barras rectangulares con
igual longitud de ancho, dispuestos a una misma distancia de separación entre sí. Es
empleado para observar el comportamiento individual de cada elemento por medio de la
comparación de las frecuencias de variables que intervienen en la distribución.
ITEMS CANTIDAD
Mamposteria 17
CANTIDAD
Contrapiso 15 30
25
Cielorraso 22 20
15
Revoque grueso 25
10
Revoque fino 11 5
0
Cielorraso 10
100
17
16
14
12
10
8
6
4
2
0
Edad 5 15 25 35
Polígono de frecuencias:
El polígono de frecuencias es un tipo de diagrama diferencial, que se emplea para
observar el comportamiento de variables cuantitativas, específicamente de tipo
continuas.
Edad Cantidad
5 2 Cantidad
15 6 15
25 14
35 6 10
45 2
30 5
0
0 10 20 30 40 50
18
Este gráfico, también llamado gráfico de pastel, tiene forma de circunferencia dividida en
regiones según la dimensión de la frecuencia absoluta, relacionada con los grados que le
correspondan.
𝟑𝟔𝟎° × 𝒇𝒊
°𝑪 =
𝒏
ITEMS CANTIDAD
CANTIDAD
Mamposteria 17
Contrapiso 15 Mamposteria Contrapiso
Cielorraso 22 Cielorraso Revoque grueso
Revoque grueso 25 Revoque fino Cielorraso
Revoque fino 11
10% 17%
Cielorraso 10 11%
15%
100
25%
22%
19
La ojiva es un tipo de gráfico integral, que se construye con la frecuencia absoluta acumulada.
En tal caso se observa el comportamiento de las variables de forma acumulada.
En el gráfico siguiente se observan diferentes edades, para una muestra de 35, se observa
que 23 personas tienen hasta 8 años de edad. A partir de lo observado podemos analizar el
comportamiento hasta la edad de ocho años.
20
15
10
0
0 5 10 15
Existen otros tipos diagramas que son útiles para el estudio de las diversas variables
estadísticas. En tal caso recomiendo indagar a profundidad sobre los gráficos estadísticos.
20
1) No agrupados 2) No agrupados
25 33 27 20 14 21 33 29 25 17
1 6 8 4 5
31 18 16 29 33 22 23 17 21 26
4 1 5 3 8
13 20 27 37 26 19 25 24 25 20
4 6 2 9 3 25 29 33 17 22 25 31 27 21 14
4 10 2 1 4 24 27 23 15 21 24 18 25 23 24
1) Tabla
3) Tabla
𝒙𝒊 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒇𝒊 𝒙𝒊
4 5 Deporte 𝑓𝑖 𝑓𝑟 𝐹𝑟 𝒇𝒊 𝒙𝒊
6 10 Baloncesto 9
8 15 Baseball 12
10 8 Futbol 6
12 7 Sin deporte 3
Total Total 30
2) Tabla 4) Tabla
xi 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒇𝒊 𝒙𝒊 𝒙𝒊 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒇𝒊 𝒙𝒊
800 4 4.2 1
950 6 4.6 2
1000 12 5 8
1200 10 5.2 5
1400 8 5.5 4
Total Total
III) Con las tablas construidas en el ejercicio “I”, construir el Histograma y el polígono
de frecuencias.
21
22
Las Medidas de Tendencia Central (MTC), son medidas numéricas de localización central.
Muestran la forma como se agrupan los valores de una distribución estadística.
Las Medidas de Tendencia Central (MTC), están dirigidas básicamente al procesamiento de
datos cuantitativos.
Las Medidas de Tendencia Central (MTC) que se analizan son las siguientes:
1. Media:
a. Media aritmética
b. Media geométrica
c. Media armónica
d. Media cuadrática
e. Media ponderada
2. Moda
3. Mediana
En esta unidad nos limitaremos a calcular: Media, Moda, Mediana, tanto para datos
agrupados, como para datos no agrupados.
Media aritmética
23
Existen dos formas de procesar los datos cuantitativos (sea de una población o de una
muestra), en una tabla de distribución de frecuencias:
a) Procesamiento de datos no agrupados.
b) Procesamiento de datos agrupados.
∑𝒌𝒊=𝟏 𝒙𝒊
̅=
𝒙
𝒏
Esta fórmula nos indica que se deben sumar cada una de las observaciones muestral, sin
importar que esta observación se repita o no.
Ejemplo 1: Calcular la Media Aritmética con los siguientes datos cuantitativos, procesando los datos
sin agruparlos:
24
∑𝒌𝒊=𝟏 𝒇𝒊 𝒙𝒊
̅=
𝒙
𝒏
Esta fórmula nos indica que debemos realizar la sumatoria del producto de cada modalidad
con su respectiva frecuencia absoluta, y luego dividir entre la muestra.
Ejemplo 3: Los siguientes datos cuantitativos serán procesados sin agrupar para calcular la Media
Aritmética:
8, 8, 10, 10, 10, 12, 12, 12, 12, 12, 14, 14, 14, 14, 16, 16
8 2 2 0.125 0.125 16
10 3 5 0.1875 0.3125 30
12 5 10 0.3125 0.625 60
14 4 14 0.25 0.875 56
16 2 16 0.125 1 32
Total 16 1 194
𝒌
∑𝒌𝒊=𝟏 𝒇𝒊 𝒙𝒊 = 𝟏𝟗𝟒 𝒏 = 𝟏𝟔 ∑ 𝒇𝒊 𝒙𝒊
𝒊=𝟏
∑𝒌𝒊=𝟏 𝒇𝒊 𝒙𝒊 𝟏𝟗𝟒
̅=
𝒙 = = 𝟏𝟐. 𝟏𝟐𝟓
𝒏 𝟏𝟔
25
1. Si las calificaciones de un alumno en las distintas asignaturas de un curso durante una evaluación
fueron: 95; 85; 86; 75; 83; 75. Hallar la calificación media de la evaluación.
2. La media de 6 elementos se sabe que es 10. Sabiendo que cinco de ellos son: 8, 12, 13, 5 y 9,
hallar el elemento que falta.
3. Un alumno obtiene en tres exámenes parciales las siguientes notas: 7, 5 y 3; en el examen final
obtiene un 6. Suponiendo que esta nota final tenga doble valor que las parciales, ¿cuál será su
nota media?
4. Si la renta anual media de los trabajadores del campo es de 1,000,000 de pesos y la renta anual
media de los trabajadores de la construcción en esa población es de 1,200,000 pesos, ¿sería la
renta anual media para ambos grupos de 1,100,000 pesos? Explica.
5. Por 4 años consecutivos el propietario de una casa compró gas para el uso común de los
inquilinos, cada galón registró el precio por año $95.70, $100.90, $102.25 y $108.25. ¿Cuál fue el
costo promedio del gas en los 4 años?
a)
Xi 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒇𝒊 𝒙𝒊
4 5
6 10
8 15
10 8
12 7
Total
26
Xi 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒇𝒊 𝒙𝒊
800 4
950 6
1000 10
1200 10
1400 8
1600 2
Total
c)
C 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒇𝒊 𝒙𝒊
4.2 1
4.6 2
5 8
5.2 5
5.5 4
Total
27
Para determinar la Media aritmética con datos agrupados, multiplicamos la frecuencia absoluta de
cada clase por su respectiva marca de clase (Punto medio de la clase), dividiendo la sumatoria entre
la muestra.
∑𝒌𝒊=𝟏 𝒇𝒊 𝒙𝒊
̅=
𝒙
𝒏
Ejemplo 4: Calcular la Media Aritmética para los siguientes datos cuantitativos, agrupando los datos:
Clase 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
10-16 14 14 0.14 0.14 6 13 182
16-22 22 36 0.22 0.36 6 19 418
22-28 31 67 0.31 0.67 6 25 775
28-34 23 90 0.23 0.9 6 31 713
34-40 10 100 0.1 1 6 37 370
100 2458
∑ 𝒇𝒊 𝒙𝒊
𝒊=𝟏
∑𝒌𝒊=𝟏 𝒇𝒊 𝒙𝒊 𝟐𝟒𝟓𝟖
̅=
𝒙 = = 𝟐𝟒. 𝟓𝟖
𝒏 𝟏𝟎𝟎
28
Una desventaja de la media aritmética es que la misma está se ve afectada por los valores
extremos. En tal caso puede estar muy lejos de ser una representación de la muestra, por tal
razón no se recomienda su uso en distribuciones muy asimétricas.
Ejercicios:
Completar las siguientes tablas y calcular la media aritmética
1) Tabla:
PUNTUACIÓN 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
20-30 1
30-40 2
40-50 3
50-60 11
60-70 21
70-80 43
80-90 32
90-100 9
TOTAL 122
29
Pesos
𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
(Kg)
50 – 55 2
55 – 60 5
60 – 65 9
65 – 70 15
70 – 75 12
75 – 80 5
80 – 85 2
TOTAL 50
3) Tabla
10-30 50
30-60 55
60-90 40
90-120 20
30
Salarios No. de
(Miles $) 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
empleados 𝑓𝑖
10-16 14
16-22 22
22-28 31
28-34 23
34-40 10
5) Tablas
Nº de Nº de 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
acciones accionistas 𝑓𝑖
0-20 180
20-60 380
60-100 1030
100-500 50
500-1000 10
31
̅̅̅̅
𝑿𝒈 = 𝒏√𝒙𝟏 × 𝒙𝟐 × 𝒙𝟑 × 𝒙𝟒 … . .× 𝒙𝒏
𝒏
̅̅̅̅
𝑿𝒈 = ට𝒙𝒇𝟏 𝟏 × 𝒙𝒇𝟐 𝟐 × … . 𝒙𝒇𝒌 𝒌
Donde:
̅̅̅
1. 𝑋 𝑔 Es la media geométrica.
2. 𝑥𝑖 Es elemento de la muestra o de la población.
3. 𝑓𝑖 Es la frecuencia absoluta simple.
Ejemplo1:
Calcular la media geométrica de los siguientes datos: 2, 4, 5, 6, 8, 10
La muestra es n = 6
𝒏
La ecuación correspondiente es ̅̅̅̅
𝑿𝒈 = √𝒙𝒇𝟏 𝟏 × 𝒙𝒇𝟐 𝟐 × … . 𝒙𝒇𝒌 𝒌
Como se puede observar en la distribución, cada elemento tiene frecuencia absoluta uno (1),
por tanto tendremos que:
𝟔
̅̅̅̅
𝑿𝒈 = √𝟐 × 𝟒 × 𝟓 × 𝟔 × 𝟖 × 𝟏𝟎 = 𝟓. 𝟏𝟖
32
xi fi
2 1 Como se puede observar en la distribución, cada elemento tiene como exponente,
4 3 la frecuencia absoluta correspondiente, por tanto, tendremos que:
6 2
8 3 𝟏𝟎
10 1 ̅̅̅̅
𝑿𝒈 = √𝟐 × 𝟒𝟑 × 𝟔𝟐 × 𝟖𝟑 × 𝟏𝟎 = 𝟓. 𝟒𝟔
n 10
Nota: Para el caso correspondiente a los datos agrupados, 𝒙𝒊 está dado por la marca de la
clase.
• La media geométrica está basada en todas las observaciones, por lo que está
afectada por todos los valores de la variable. Sin embargo, da menos pesos a los
valores extremadamente grandes que el que les da la media aritmética.
33
𝒏
̅̅̅̅𝒂 =
𝑿
𝒇
∑ 𝒊
𝒙𝒊
Es decir:
𝒏
̅̅̅̅
𝑿𝒂 =
𝒇𝟏 𝒇𝟐 𝒇𝒌
𝒙𝟏 + 𝒙𝟐 + . . . . + 𝒙𝒌
Ejemplo1:
Calcular la media armónica de los siguientes datos: 2, 4, 5, 6, 8, 10
n=6
Aplicando la fórmula correspondiente, tendremos que:
𝟔
̅̅̅̅𝒂 =
𝑿 = 𝟒. 𝟒𝟕
𝟏 𝟏 𝟏 𝟏 𝟏 𝟏
+ + + + +
𝟐 𝟒 𝟓 𝟔 𝟖 𝟏𝟎
̅̅̅̅
𝑿𝒂 = 𝟒. 𝟒𝟕
Ejemplo2:
Calcular la media armónica de los siguientes datos: 2, 4, 4, 4, 6, 6, 8, 8, 8, 10
La frecuencia absoluta es n = 10
La ecuación correspondiente es:
𝒏
̅̅̅̅𝒂
:𝑿 = 𝒇𝟏 𝒇 𝒇
+ 𝟐 + ... .+ 𝒌
𝒙𝟏 𝒙𝟐 𝒙𝒌
𝟏𝟎
̅̅̅̅
𝑿𝒂 = = 𝟒. 𝟖𝟔
𝟏 𝟑 𝟐 𝟑 𝟏
+ + + +
𝟐 𝟒 𝟔 𝟖 𝟏𝟎
34
Nota: En el caso de los datos agrupados, 𝒙𝒊 está dado por la marca de la clase.
• La media armónica se basa en todas las observaciones; por tanto, está afectada
por todos los valores de la distribución.
35
⬚ ∑ 𝒇𝒊 𝒙𝟐𝒊
̅̅̅̅𝒄 = ඨ
𝑿
𝒏
Esta fórmula es aplicable tanto para datos agrupados, como para no agrupados.
Ejemplo1:
Calcular la media cuadrática de los siguientes datos: 2, 4, 5, 6, 8, 10
n=6
Aplicando la fórmula correspondiente, tendremos que:
⬚ 𝟐𝟐 + 𝟒𝟐 + 𝟓𝟐 + 𝟔𝟐 + 𝟖𝟐 + 𝟏𝟎𝟐
̅̅̅̅𝒄 = ඨ
𝑿 = 𝟔. 𝟑𝟗
𝟔
̅𝑿̅̅̅𝒄 = 𝟔. 𝟑𝟗
Ejemplo2:
La frecuencia absoluta es n = 10
36
Ejercicios:
4) Por 4 años consecutivos el propietario de una casa compró gas para el uso común de
los inquilinos, cada galón registró el precio por año $95.70, $100.90, $102.25 y
$108.25.
¿Cuál fue el costo promedio del gas en los 4 años, suponiendo que el consumo fue de
1500 galones cada año?
¿Cuál fue el costo promedio del gas en los 4 años, suponiendo que el consumo fue de
1000 galones el primer año, 1200 galones el segundo año, 1400 galones el tercer año
y 1600 galones el cuarto año?
37
38
𝒙𝟏 𝒘𝟏 + 𝒙𝟐 𝒘𝟐 + 𝒙𝟑 𝒘𝟑 + . . . +𝒙𝒌 𝒘𝒌
̅̅̅̅𝒑 =
𝑿
𝒘𝟏 + 𝒘𝟐 + 𝒘𝟏 + . . . +𝒘𝒌
∑𝒙𝒌 𝒘𝒌
̅̅̅̅
𝑿𝒑 =
∑𝒘𝒌
Ejemplo:
Un estudiante de una Universidad obtiene en tres asignaturas diferentes, las siguientes
calificaciones: Cálculo 92, Sociales 85 y Redacción 90. Si las asignaturas tienes los siguientes
créditos: Cálculo 5 Cr., Sociales 3 Cr. y Redacción 4 Cr., Cual es la calificación media del
estudiante?.
En este caso el número de crédito corresponde al peso de cada asignatura.
Para cada asignatura se multiplica la calificación por el número de crédito, suman los
productos y resultado se divide entre la sumatoria de los pesos indicados.
𝟗𝟐 × 𝟓 + 𝟖𝟓 × 𝟑 + 𝟗𝟎 × 𝟒 𝟏, 𝟎𝟕𝟓
̅̅̅̅𝒑 =
𝑿 = = 𝟖𝟗. 𝟓𝟖 ≅ 𝟗𝟎
𝟓+𝟑+𝟒 𝟏𝟐
Ejercicios:
39
Recuerdo a los lectores, que los cálculos de las Medidas de Tendencia Central, se
realizarán mediante el procesamiento de datos no agrupados y de datos agrupados.
Muestra par
𝒏
• Dividimos la muestra entre dos:
𝟐
• El resultado de este cociente, es la posición del dato correspondiente a la mediana.
• Debido a que dos son los datos que ocupan la misma posición, sumamos los datos y
el resultado lo dividimos entre dos, siendo este valor la mediana.
8, 8, 10, 10, 10, 12, 12, 12, 14, 14, 14, 14, 15, 15, 15, 18
n = 16
Determinamos la posición del dato correspondiente:
𝒏 𝟏𝟔
𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 = = =𝟖
𝟐 𝟐
La posición es 8
Procedemos a contar los datos organizados de izquierda a derecha y luego de derecha a
izquierda:
8, 8, 10, 10, 10, 12, 12, 12, 14, 14, 14, 14, 15, 15, 15, 18
Posición es 8 Posición es 8
40
Muestra impar
• Como la muestra es impar, sumamos uno (1) a la muestra, luego dividimos entre dos:
𝑛+1
2
• El resultado de este cociente, es la posición del dato correspondiente a la mediana.
Ejemplo 6:
𝒏+𝟏 𝟗+𝟏 𝟏𝟎
𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 = = = =𝟓
𝟐 𝟐 𝟐
La posición es 5
Procedemos a contar los datos organizados de izquierda a derecha y luego de derecha a
izquierda
Posición es 5
𝑴𝒆 = 𝟏𝟓
41
Ejercicios:Cálculo de la Mediana
1) Determinar la mediana de la serie 5, 6, 9, 11, 15, 19, 23, 26, 27. Luego para la
serie 5, 7, 10, 15, 20, 21, 24, 27. Compara ambas.
2) José pregunta a Daniel: ¿Qué día es hoy? – y Daniel le responde: el día de hoy
corresponde a la mediana. Cuál es el día?
Xi 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒇𝒊 𝒙𝒊
8 2
10 3
12 5
14 4
16 2
Total
Xi 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒇𝒊 𝒙𝒊
4 5
6 10
8 15
10 8
12 7
Total
Xi 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒇𝒊 𝒙𝒊
4.2 1
4.6 2
5 8
5.2 5
5.5 4
Total
42
Para determinar la mediana con datos agrupados empleamos la siguiente fórmula o ecuación:
𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖−1 + ቌ2 × 𝑎𝑖 ቍ
𝑓𝑖
Ejemplo 7:
Calcular la Mediana para los siguientes datos cuantitativos, agrupando los datos:
Clase 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝑎𝑖 𝑥𝑖 𝒇𝒊 𝒙𝒊
10-16 14 14 0.14 0.14 6 13 182
16-22 22 36 0.22 0.36 6 19 418
22-28 31 67 0.31 0.67 6 25 775
28-34 23 90 0.23 0.9 6 31 713
34-40 10 100 0.1 1 6 37 370
100 2458
La muestra es n = 100.
𝒏
Dividimos la muestra entre dos: 𝟐
𝒏 𝟏𝟎𝟎
= = 𝟓𝟎
𝟐 𝟐
El próximo mayor a 50 es 𝑵𝒊 = 𝟔𝟕 .
𝒏
Tenemos que: = 𝟓𝟎
𝟐
43
𝒏
− 𝑭𝒊−𝟏 𝟓𝟎 − 𝟑𝟔
𝑴𝒆 = 𝑳𝒊−𝟏 + ቌ𝟐 × 𝒂𝒊 ቍ = 𝟐𝟐 + ( × 𝟔) = 𝟐𝟐 + 𝟐. 𝟕𝟏 = 𝟐𝟒. 𝟕𝟏
𝒇𝒊 𝟑𝟏
𝑴𝒆 = 𝟐𝟒. 𝟕𝟏
Propiedades de la mediana:
44
PLAZAS Nº DE HOTELES 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
0-10 25
10-30 50
30-60 55
60-90 40
90-120 20
2) Tabla
Salarios Nº 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
(Miles $) Empleados
10-16 14
16-22 22
22-28 31
28-34 23
34-40 10
3) Tabla
Pesos 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒂𝒊 𝒙𝒊
ni 𝒇𝒊 𝒙𝒊
(Kg)
50 – 55 2
55 – 60 5
60 – 65 9
65 – 70 15
70 – 75 12
75 – 80 5
80 – 85 2
TOTAL 50
45
PUNTUACIÓN 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
20-29 1
30-39 2
40-49 3
50-59 11
60-69 21
70-79 43
80-89 32
90-100 9
TOTAL 122
5) Tabla
Nº de Nº de 𝐹𝑖 𝑓𝑟 𝐹𝑟 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
acciones accionistas
0-20 320
20-60 380
60-100 180
100-500 90
500-1000 30
46
Ejemplo 8:
Calcular la Moda para los siguientes datos cuantitativos 8, 8, 10, 10, 10, 12, 12, 12, 14, 14, 14, 14,
15, 15, 15, 18
En tal caso:
𝐷1 = 𝑓𝑖 − 𝑓𝑖−1
𝐷2 = 𝑓𝑖 − 𝑓𝑖+1
47
Ejemplo 9:
Calcular la Moda para los siguientes datos cuantitativos, agrupando los datos:
Clase 𝒇𝒊 𝑭𝒊 𝒇𝒓 𝑭𝒓 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
10-16 14 14 0.14 0.14 6 13 182
16-22 22 36 0.22 0.36 6 19 418
22-28 31 67 0.31 0.67 6 25 775
28-34 23 90 0.23 0.9 6 31 713
34-40 10 100 0.1 1 6 37 370
100 2458
𝑫𝟏 = 𝒇𝒊 − 𝒇𝒊−𝟏 = 𝟑𝟏 − 𝟐𝟐 = 𝟗
𝑫𝟐 = 𝒇𝒊 − 𝒇𝒊+𝟏 = 𝟑𝟏 − 𝟐𝟑 = 𝟖
𝑫𝟏 𝟗
𝑴𝒐 = 𝑳𝒊−𝟏 + ( × 𝒂𝒊 ) = 𝟐𝟐 + ( × 𝟔) = 𝟐𝟐 + 𝟑. 𝟏𝟖 = 𝟐𝟓. 𝟏𝟖
𝑫𝟏 + 𝑫𝟐 𝟗+ 𝟖
𝑴𝒐 = 𝟐𝟓. 𝟏𝟖
48
Ejercicios:
Cálcular la Moda para cada uno de los siguientes casos, completando las tablas pertinentes:
2) 2, 2, 4, 5, 5, 5, 6, 6, 8, 10
4)
5)
𝒙𝒊 𝒇𝒊
𝒙𝒊 𝒇𝒊
3.5 2
3.5 2
4.5 8
4.5 8
5.5 3
5.5 3
6.5 8
6.5 8
7.5 4
7.5 4
25
25
49
Salarios Nº
(Miles $) empleados
6 - 12 14
12 - 18 22
18 -24 30
24 - 30 22
36 - 42 8
42 - 48 4
Total 100
Tiempo de Número de
estacionamiento (min.) vehículos
0-60 1220
60-120 2810
120-180 600
180-240 400
240-300 300
300-360 120
360-540 50
Total 5500
Nº de
Nº de Galones
vehìculos
1–5 15
5 – 10 20
10 – 15 10
15 – 20 5
50
50
51
𝒌𝒏
𝑷𝒌 = (𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏)
𝟏𝟎𝟎
En tal caso:
K Es el valor del percentil (valor comprendido entre 0 y 100).
n Es la muestra.
𝑷𝒌 Representa la posición correspondiente al dato de la distribución.
Ejemplo:
Calcular el percentil 65 de los siguientes datos: 2, 4, 5, 5, 6, 8, 9, 10.
𝑷𝟓𝟓 = 𝟔
Deciles:
Los deciles son medidas de posición que dividen los datos en diez grupos iguales. En
tal sentido 𝑑1 = 𝑃10 , 𝑑2 = 𝑃20 , 𝑑3 = 𝑃30 , y así sucesivamente.
Ejemplo:
Calcular el 𝒅𝟒 de los siguientes datos: 2, 4, 5, 5, 6, 8, 9, 10.
Sabemos que 𝑑4 = 𝑃40 , por tanto:
𝟒𝟎 × 𝟖
𝒅𝟒 = 𝑷𝟒𝟎 = = 𝟑. 𝟐(𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏)
𝟏𝟎𝟎
𝒅𝟒 = 𝟓
Cuartiles
Los deciles son medidas de posición que dividen los datos en cuatro grupos iguales.
Las agrupaciones son 𝑸𝟏 , 𝑸𝟐 , 𝑸𝟑 , 𝑸𝟒 . Los cuartiles a ser calculados son 𝑸𝟏 , 𝑸𝟐 , 𝑸𝟑 .
53
𝑸𝟏 = 𝟒
El cuartil dos tiene por debajo de si el 50% de los datos. Se emplea la siguiente
fórmula o ecuación:
𝟐𝒏
𝑸𝟐 = (𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏)
𝟒
Ejemplo:
Calcular el 𝑸𝟏 de los siguientes datos: 2, 4, 5, 5, 6, 8, 9, 10.
n=8
𝟐×𝟖 𝟏𝟔
Por tanto: 𝑸𝟐 = = = 𝟒(𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏)
𝟒 𝟒
𝑸𝟐 = 𝟓
54
Ejemplo:
Calcular el 𝑸𝟏 de los siguientes datos: 2, 4, 5, 5, 6, 8, 9, 10.
n=8
𝟑×𝟖 𝟐𝟒
Por tanto: 𝑸𝟑 = = = 𝟔 (𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏)
𝟒 𝟒
𝑸𝟑 = 𝟖
𝒌𝒏
− 𝑭𝒊−𝟏
𝑷𝒌 = 𝑳𝒊−𝟏 + ቌ𝟏𝟎𝟎 × 𝒂𝒊 ቍ
𝒇𝒊
55
𝒏 𝟐𝒏
− 𝑭𝒊−𝟏 − 𝑭𝒊−𝟏
𝑸𝟏 = 𝑳𝒊−𝟏 + ቌ𝟒 × 𝒂𝒊 ቍ 𝑸𝟐 = 𝑳𝒊−𝟏 + ቌ 𝟒 × 𝒂𝒊 ቍ
𝒇𝒊 𝒇𝒊
𝟑𝒏
− 𝑭𝒊−𝟏
𝑸𝟑 = 𝑳𝒊−𝟏 + ቌ 𝟒 × 𝒂𝒊 ቍ
𝒇𝒊
Ejemplo:
Con los datos siguientes dados en la siguiente tabla, calcular:
• 𝑄1
• 𝑃45
• 𝑑6
Clase 𝒇𝒊 𝑭𝒊 𝒇𝒓 𝑭𝒓 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
10-16 14 14 0.14 0.14 6 13 182
16-22 22 36 0.22 0.36 6 19 418
22-28 31 67 0.31 0.67 6 25 775
28-34 23 90 0.23 0.9 6 31 713
34-40 10 100 0.1 1 6 37 370
100 2458
56
𝟐𝟓 − 𝟏𝟒
𝑸𝟏 = 𝟏𝟔 + ( × 𝟔) = 𝟏𝟗
𝟐𝟐
57
𝟒𝟓 − 𝟑𝟔
𝑷𝟒𝟓 = 𝟐𝟐 + ( × 𝟔) = 𝟐𝟑. 𝟕𝟒
𝟑𝟏
El percentil es: 𝑷𝟒𝟓 = = 𝟐𝟑. 𝟕𝟒
Determinando el decil 6:
Como un decil 6 equivale a un percentil 60, tendremos que: k = 60.
Los pasos a dar son los mismos de los percentiles.
𝑘×𝑛 60×100
Primer paso: multiplicamos 𝒌 × 𝒏 y lo dividimos entre 100: = = 𝟔𝟎
100 100
58
1) José espera con ansias el fin del mes de noviembre. Un día pregunta: ¿a cómo estamos hoy? y
alguien le responde: el día de hoy equivale al percentil 90 de los días del mes. ¿Cuál es la fecha?
ni
16
14
12
10
8
ni
6
4
2
0
[0,1) [1,2) [2,3) [3,4) [4,5) [5,6) [6,7) [7,8) [8,9) [9,10)
59
6 - 12 14 14 0.14 0.14 6 9
12 - 18 22 36 0.22 0.36 6 15
18 -24 30 66 0.30 0.66 6 21
24 - 30 22 88 0.22 0.88 6 27
36 - 42 8 96 0.08 0.96 6 39
42 - 48 4 100 0.04 1 6 45
Total 100
Q3 P35 D7
Salarios Nº 𝑭𝒊 𝒇𝒓 𝑭𝒓 𝒂𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
(Miles $) empleados
16 – 22 10
22 – 38 40
38 – 44 20
44 – 56 12
56 – 64 10
64 - 80 8
Total 100
60
Rango
Esta medida solo toma en consideración dos de los datos de la muestra o de la
población: el valor mínimo y el valor máximo
Anteriormente calculamos el rango de una muestra:
𝑹 = 𝑽𝑴 − 𝑽𝒎
Varianza
Al momento de calcular la varianza, debemos considerar dos situaciones:
1) El cálculo de la varianza para una población, donde empleamos la siguiente
fórmula o ecuación:
∑(𝒙𝒊 − 𝝁)𝟐
𝝈𝟐 =
𝑵
61
̅)𝟐
∑(𝒙𝒊 − 𝒙
𝑺𝟐 =
𝒏−𝟏
o también
𝟐
̅)𝟐
∑ 𝒏𝒊 (𝒙𝒊 − 𝒙
𝑺 =
𝒏−𝟏
Estas fórmulas son aplicables tanto para en datos No agrupados, como en datos
agrupados. Solo debemos tomar en cuenta que 𝒙𝒊 , en los datos agrupados
corresponde a la marca de la clase.
En nuestro caso, para este curso nos circunscribiremos en el cálculo de la varianza
muestral.
̅) 𝟐
∑(𝒙𝒊 − 𝒙 (𝟐 − 𝟔)𝟐 + (𝟒 − 𝟔)𝟐 + (𝟓 − 𝟔)𝟐 + (𝟔 − 𝟔)𝟐 + (𝟖 − 𝟔)𝟐 + (𝟏𝟎 − 𝟔)𝟐
𝑺𝟐 = =
𝒏−𝟏 𝟔−𝟏
𝟒𝟏
𝑺𝟐 = = 𝟖. 𝟐
𝟓
62
𝑺𝟐 = 𝟖. 𝟐
̅) 𝟐
∑(𝒙𝒊 − 𝒙
𝑺 = √𝑺𝟐 = ඨ
𝒏−𝟏
𝑺 = √𝑺𝟐 = √𝟖. 𝟐 = 𝟐. 𝟖𝟔
Por tanto la desviación típica o estándar es: 𝑺 = 𝟐. 𝟖𝟔
• La desviación estándar será siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
• Si a todos los valores de la variable se les suma un número la desviación estándar no
varía.
• Si todos los valores de la variable se multiplican por un número la desviación estándar
queda multiplicada por dicho número.
• Si tenemos varias distribuciones con la misma media y conocemos sus respectivas
desviaciones estándar se puede calcular la desviación estándar total.
63
Coeficiente de Variación
El coeficiente de variación, se determina mediante la siguiente fórmula o ecuación:
𝑺
𝑪𝒗 = × 𝟏𝟎𝟎
̅
𝒙
𝟐. 𝟖𝟔
𝑪𝒗 = × 𝟏𝟎𝟎 = 𝟒𝟕. 𝟔𝟕
𝟔
64
∑ 𝒇𝒊 (𝒙𝒊 − 𝒙)𝟐
⬚
Media aritmética: 𝑥̅ = 24.58
La diferencia: (𝒙𝒊 − 𝒙) corresponde a la maraca de cada clase menos la media aritmética.
̅)𝟐
∑ 𝒏𝒊 (𝒙𝒊 − 𝒙 𝟐𝟒𝟗𝟔.𝟎𝟏 𝟐𝟒𝟗𝟔.𝟎𝟏
La varianza está dada por: 𝑺𝟐 = = = = 𝟐𝟓. 𝟐𝟏
𝒏−𝟏 𝟏𝟎𝟎−𝟏 𝟗𝟗
65
Xi fi
1 3
2 6
3 7
4 7
5 3
6 0
7 4
Calcule:
a) Varianza.
b) Desviación estándar.
c) Coeficiente de dispersión de las notas.
d) Cuantifique la simetría en la distribución de las notas.
66
30-40 10
40-50 50
50-60 30
60-70 20
70-80 15
80-90 12
90-105 8
TOTAL 150
67
Pesos Z
𝑭𝒊 𝒇𝒓 𝑭𝒓 𝒂𝒊 𝒙𝒊 (𝒙𝒊 − 𝒙) (𝒙𝒊 − 𝒙)𝟐 𝒇𝒊 (𝒙𝒊 − 𝒙)𝟐
(Kg) 𝒇𝒊 𝒇 𝒊 𝒙𝒊
53 - 55 2
56 - 58 5
59 - 61 9
62 - 64 15
65 - 67 12
68 - 70 5
71 - 73 2
TOTAL 50
68
Distribución Simétrica:
Una distribución es simétrica cuando los datos presentan una distribución uniforme
respecto a un dato central, esto significa que estamos ante una distribución normal o
equilibrada.
10
8
6
4
2
0
0 10 20 30
Distribución Asimétrica:
Una distribución es Asimétrica cuando los datos presentan una distribución desplazada
a uno de los dos extremos de los datos respecto a un dato central (Izquierda o derecha).
Cuando la distribución es asimétrica se presentan las siguientes situaciones:
a) Asimetría negativa o sesgo negativo: En tal caso, se presenta en los datos un
desplazamiento hacia la izquierda respecto a la media.
En la asimetría negativa o sesgo negativo: 𝑥̅ < 𝑀𝑒
69
10
0
0 10 20 30
70
25
20
15
10
0
0 10 20 30
𝑥𝑖 𝑓𝑖
4 5 20
8 20 160
12 15 180
16 6 96
20 4 80
50 536
Mo = 8 Me = 10 𝑥̅ = 10.72
25
20
15
10
5
0
0 5 10 15 20 25
71
Mo = 16 Me = 14 𝑥̅ =12.96
30
20
10
0
0 5 10 15 20 25
72
La teoría de probabilidades requiere para una mayor y mejor comprensión, del conocimiento de
una diversidad de herramientas matemáticas, tales como: Teoría de conjunto y análisis
combinatorio.
Aunque no vamos a introducir estos contenidos, se considera necesario tener cierto dominio de
los mismos.
Definición de probabilidad:
Algunos fenómenos, se manejan al azar, y en unas mismas condiciones. Por ejemplo, ¿Si sé
lanza un dado al aire qué número saldrá? Estos sucesos que ocurren al azar, son sucesos
aleatorios o estocásticos. El estudio de estos sucesos se realiza a través del cálculo de
probabilidades.
En tal caso podemos definir la Probabilidad como una medida numérica que indica la
posibilidad de que algo suceda.
Los valores muy cercanos a cero, indican que hay muy pocas posibilidades de ocurrencia, y los
valores muy cercanos a uno, indican que hay grandes posibilidades de ocurrencia del evento.
𝒆𝒗𝒆𝒏𝒕𝒐
𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅 𝒅𝒆 𝒖𝒏 𝒆𝒗𝒆𝒏𝒕𝒐 =
𝑬𝒔𝒑𝒂𝒄𝒊𝒐 𝑴𝒖𝒆𝒔𝒕𝒓𝒂𝒍
Experimento aleatorio: Es aquel que puede producir resultados diferentes en unas mismas
condiciones.
Ejemplo: Lanzar una moneda al aire; Tirar un dado.
73
Espacio muestral:
• Es el conjunto de todos los sucesos elementales distintos que pueden producirse en un
experimento.
• Es el conjunto de todos los resultados posibles de un experimento.
Sucesos estocásticos: Son los fenómenos que ocurren al azar. Estos son los diversos
subconjuntos del espacio muestral.
Probabilidad clásica
𝒏𝒊
𝑷(𝒙) =
𝑬𝒎 (𝒏)
Ejemplo:
Se introducen 10 monedas de colores diferentes en una urna, 3 blanca, 5 azul, 2 verde. Hallar
posibilidad de obtener:
a) Una blanca.
74
3
𝑃(𝑥 = 3) = = 0.33
10
5
𝑃(𝑥 = 5) = = 0.5
10
2
𝑃(𝑥 = 2) = = 0.2
10
Leyes de la probabilidad
• Dos eventos se presenten de manera independiente y en momentos diferentes. Estos son eventos
mutuamente excluyentes.
• Dos eventos se presenten en mismo momento. Estos son eventos no mutuamente excluyentes.
Aplicando la regla de la adición tendremos para dos eventos A y B:
75
Cuando ocurren dos eventos de manera consecutiva, de un espacio muestral, se pueden presentar dos
situaciones diferentes:
• Los eventos son independientes entre sí, por lo que no influye uno sobre el otro. Un evento está
condicionado por el resultado del evento anterior.
• Cuando un evento A no influye en el resultado de un segundo evento B. Estos eventos están bajo
condiciones de independencia estadística.
• Cuando un evento A influye sobre el resultado de un segundo evento B. Estos eventos están bajo
condiciones de dependencia estadística. En tal caso tendremos:
𝑷(𝑨 ∩ 𝑩)
𝑷(𝑩/𝑨) =
𝑷(𝑨)
76
6) En cierta Facultad el 25% de los estudiantes reprobó matemáticas, el 15% química y el 10%
las dos. Determinar si se selecciona un estudiante al azar, la probabilidad de que:
a. repruebe matemáticas dado que ha reprobó química
b. repruebe química dado que ha reprobó matemáticas
c. repruebe matemáticas o química.
77
78