Está en la página 1de 21

UNIVERSIDAD NACIONAL DE LA AMAZONÍA PERUANA

ESCUELA DE POST-GRADO

MAESTRÍA EN GESTIÓN PÚBLICA

CURSO : MÉTODOS CUANTITATIVOS

PROFESOR : ING. Miguel Cornelio chujutalli

TEMA : MEDIDAS DE TENDENCIA CENTRAL Y DE


DISPERSIÓN

ALUMNOS : DÍAZ FERNÁNDEZ, JOLVER JOSSEL


RAMÍREZ GRIMALDO, OSCAR ALEXIS
RAMÍREZ LOPEZ, ELMER ABEL
TORRES SIAS, ALEX

GRUPO : F

IQUITOS, PERÚ

2023
DEDICATORIA
En primer lugar agradecemos a dios por habernos permitido llegar hasta
este punto y habernos dado salud, ser el manantial de vida y darnos lo
necesario para seguir adelante día a día para lograr nuestros objetivos,
además de su infinita bondad y amor.

Al Ingeniero Miguel Cornelio Chujutalli, por su apoyo ofrecido en este


trabajo, por habernos transmitidos los conocimientos necesarios para
poder llegar a la culminación de dicho trabajo.
Resumen

Las medidas de tendencia central son aquellas medidas estadísticas que


pretenden hacer un resumen en un solo valor a un conjunto de valores.
Representa un centro en torno al cual se encuentra ubicado el conjunto de los
datos. Las medidas de tendencia central más utilizados son: media, mediana y
moda. Las medidas de dispersión en cambio miden el grado de dispersión de
los valores de la variable. Dicho en otros términos las medidas de dispersión
pretenden evaluar en qué medida los datos difieren entre sí. De esta forma,
ambos tipos de medidas usadas en conjunto permiten describir un conjunto de
datos entregando dicha información acerca de su posición y su dispersión. Los
procedimientos para obtener las medidas estadísticas difieren levemente
dependiendo de la forma en que se encuentren los datos o valores dados. Si
los datos se encuentran ordenados en una tabla estadística diremos que se
encuentran “agrupados” y si los datos no están en una tabla hablaremos de
datos “no agrupados”. Según este criterio, haremos primero el estudio de las
medidas estadísticas para datos no agrupados y luego para datos agrupados
Objetivos:

Objetivo general:

 Analizar e interpretar un conjunto de datos cualitativos y cuantitativos


obtenidos mediante una encuesta utilizando las medidas de tendencia
central y de dispersión

Objetivos específicos:

 Reducir los datos en un valor representativo


 Nos indican qué tanto se dispersan o agrupan los datos con respecto a
su media aritmética

INTRODUCCIÓN

La Estadística Descriptiva es aquella que analiza, estudia y describe a los


conjuntos de individuos de una población. Su propósito es de obtener
información, analizarla, elaborarla y simplificarla lo necesario para que pueda
ser interpretada cómoda y rápidamente.

Cuando se tiene un registro de los datos numéricos a veces se necesita extraer


uno que sea representativo de todos, es decir, que ofrezca una cierta idea
del valor más común, ya sea porque es el que más se repite o porque tenga la
misma cantidad de datos antes o después de él o porque es el valor alrededor
del cual están los demás. Este tipo de datos que se ubican hacia el lugar
central de la lista y que indican medidas representativas se llama medidas de
tendencia central o de posición.

Los valores que se dan en estas medidas están incluidos entre el menor y el


mayor de los datos lo que no significa que ocuparán exacta y necesariamente
su centro, ni que los valores que tomen tengan que coincidir con alguno de los
que han sido recolectados. Entre estas medidas se tienen la moda, la mediana,
la media (aritmética, geométrica) y los percentiles, entre otras.

A veces es necesario calcular todos, a veces dos y en otros casos una medida
es la apropiada, es decir, se pueden utilizar según el tipo de fenómeno que se
analice y las características de los datos que se procesan.
MEDIDAS DE TENDENCIA CENTRAL EN DATOS NO AGRUPADOS

Las medidas de tendencia central son utilizadas para describir el valor central de un
conjunto de datos no agrupados. Las tres medidas de tendencia central más comunes
son la media aritmética, la mediana y la moda.

Estas medidas se utilizan para obtener una comprensión general de la distribución y el


comportamiento del conjunto de datos, proporcionando una representación central que
resuma la información de manera concisa. Es importante seleccionar la medida de
tendencia central más adecuada para el tipo de datos y el objetivo del análisis. Aquí
tienes un resumen de cada una de ellas:

1. LA MEDIA:

También conocida como promedio, es una medida de tendencia central


utilizada para describir el valor central de un conjunto de datos no agrupados.
También se conoce como promedio o media aritmética. Para calcular la media,
se suman todos los valores en el conjunto de datos y luego se dividen entre el
número total de elementos.

Aquí una breve descripción del cálculo de la media:

a) Suma todos los valores en el conjunto de datos.


b) Divide la suma total entre el número de elementos en el conjunto.

Ejemplo: Supongamos que queremos calcular la media de las edades de un


grupo de alumnos de la maestría en Gestión Pública.

a) Recolectamos las edades de los alumnos. Supongamos que tenemos las


siguientes edades: 25, 32, 29, 45, 36, 40, 38, 42.

b) Sumamos todas las edades: 25 + 32 + 29 + 45 + 36 + 40 + 38 + 42 = 287.

c) Observamos que tenemos 8 alumnos en total.

d) Dividimos la suma total de edades entre el número de alumnos para obtener


la media: 287 / 8 = 35,88.

En este ejemplo, la media de las edades de los alumnos de la maestría es


35,88. Esto significa que en promedio, los alumnos tienen aproximadamente 35
años y 10 meses.

La media es una medida de tendencia central que proporciona una representación del
valor central de un conjunto de datos. Es sensible a los valores individuales y puede
verse afectada por valores extremos. En el contexto de las edades de los alumnos, la
media nos da una idea general de la edad promedio del grupo en estudio.1

La media aritmética, la media poblacional y la media muestral son diferentes enfoques


para calcular la media en función de la población o la muestra utilizada en el análisis
estadístico. Aquí está el concepto de cada uno de ellos, junto con un ejemplo que
ilustra cómo se aplican en un conjunto de datos no agrupados.

1
(A. Colubi)
1.1. Media aritmética: también conocida como media, es la medida de
tendencia central más comúnmente utilizada. Se calcula sumando todos los
valores en el conjunto de datos y dividiendo la suma total entre el número
de elementos. La media aritmética se representa mediante el símbolo "x̄".

Ejemplo: Supongamos que queremos calcular la media aritmética de la


altura de un grupo de alumnos de la maestría en Gestión Pública.

1. Recolectamos las alturas de los alumnos. Supongamos que tenemos las


siguientes alturas en centímetros: 165, 170, 172, 168, 175, 180, 160, 173.

2. Sumamos todas las alturas: 165 + 170 + 172 + 168 + 175 + 180 + 160 +
173 = 1,353.

3. Observamos que tenemos 8 alumnos en total.

4. Dividimos la suma total de alturas entre el número de alumnos para


obtener la media: 1353 / 8 = 169,13.

En este ejemplo, la media aritmética de la altura de los alumnos de la


universidad es aproximadamente 169,13 centímetros. Esto significa que en
promedio, la altura de los alumnos es de alrededor de 169 centímetros.

La media aritmética es una medida de tendencia central que proporciona


una representación del valor central de un conjunto de datos. En el contexto
de la altura de los alumnos, la media nos da una idea general de la altura
promedio del grupo en estudio. Es importante tener en cuenta que la media
puede verse afectada por valores extremos, por lo que es recomendable
analizar cualquier posible influencia de datos atípicos en la interpretación de
los resultados.

1.2. Media poblacional: se refiere a la media de una población completa. Sin


embargo, en la mayoría de los casos, es impracticable o imposible medir o
evaluar cada elemento de la población completa. Por lo tanto, la media
poblacional se estima utilizando información de una muestra representativa
de la población. Se representa mediante el símbolo "μ" (mu).

Ejemplo: Supongamos que estamos interesados en conocer la talla


promedio de todos los estudiantes en una universidad. Medir la talla de
cada estudiante es difícil, por lo que tomamos una muestra aleatoria de 100
estudiantes y medimos sus alturas. La media poblacional estimada sería la
media de las alturas de esta muestra.

1.3. Media muestral: se calcula utilizando los datos de una muestra


específica tomada de una población más grande. Es una estimación de la
media poblacional y se utiliza para inferir información sobre la población
completa. Se representa mediante el símbolo "x̄" o "M".

Ejemplo: Continuando con el ejemplo anterior, si tomamos una muestra de


10 estudiantes y medimos sus tallas, la media muestral sería la media de
las tallas de esa muestra en particular.

a) Supongamos que después de realizar el proceso, obtenemos las


siguientes tallas en centímetros en el grupo: 162, 174, 178, 160, 172,
181, 164, 175, 167, 170
b) Luego, sumamos todas las alturas: 162 + 174 + 178 + 160 + 172 + 181
+ 164 + 175 + 167 + 170= 1,073

c) Observamos que tenemos 10 alumnos en total.

d) Dividimos la suma total de alturas entre el número de alumnos para


obtener la media: 1,073 / 10 = 170,3.
e)
f) En este ejemplo, la media aritmética de la altura de los alumnos de la
maestría es aproximadamente 170,3 centímetros. Esto significa que en
promedio, la altura de los alumnos es de alrededor de 170 centímetros.

La media muestral es útil porque, si la muestra es representativa, proporciona una


estimación razonablemente precisa de la media poblacional. Sin embargo, es
importante tener en cuenta que la media muestral puede variar de una muestra a otra,
lo que se conoce como variabilidad muestral. 2

2. LA MEDIANA

La mediana es una medida de tendencia central utilizada para encontrar el


valor central en un conjunto de datos no agrupados. Se calcula ordenando los
datos en forma ascendente o descendente y seleccionando el valor que se
encuentra en la posición central. La mediana divide el conjunto de datos en dos
partes iguales, con la mitad de los valores por encima y la otra mitad por debajo
de ella.

Ejemplo: Supongamos que queremos calcular la mediana de las notas de un


grupo de alumnos de una universidad en un examen específico. Aquí tienes un
ejemplo de cómo podríamos calcular la mediana:

a) Recolectamos las notas de los alumnos en el examen de Métodos


Cuantitativos de la maestría en Gestión Pública. Supongamos que tenemos las
siguientes notas en orden ascendente: 08, 10, 11, 13, 14, 15, 17,19, 20.

b) Observamos que tenemos 9 alumnos en total.

c) Como el número de elementos es impar, la mediana será el valor que se


encuentra en la posición central, es decir, el quinto valor.

d) En este caso, la mediana es 14. Esta nota separa al grupo de alumnos en


dos partes iguales, con cuatro notas por debajo de 14 y cuatro notas por
encima de 14.

En este ejemplo, la mediana de las notas de los alumnos de la universidad en


el examen es 14. Esto significa que la mitad de los alumnos obtuvieron una
nota menor o igual a 14 y la otra mitad obtuvo una nota mayor o igual a 14.

En resumen, la mediana es el valor central de un conjunto de datos ordenados que


divide al conjunto en dos partes iguales. Proporciona una medida de tendencia central
robusta y es útil cuando se desea evitar la influencia de valores atípicos en el análisis
estadístico.

2
(Anderson, 2012)
3. LA MODA

La moda es una medida de tendencia central utilizada en estadística que


representa el valor o valores que ocurren con mayor frecuencia en un conjunto
de datos. Es el valor más común o más repetido en el conjunto de datos.

La moda es especialmente útil cuando se trabaja con datos cualitativos o datos


discretos, como categorías, nombres o números enteros, aunque también se
puede calcular para datos cuantitativos. Es una medida descriptiva que nos
permite identificar los valores más frecuentes y destacados en un conjunto de
datos.

La moda se calcula encontrando el valor o valores con la mayor frecuencia en


el conjunto de datos. En el caso de datos agrupados, puede haber intervalos
con diferentes modas.

Es importante tener en cuenta que la moda puede no ser una medida de


tendencia central apropiada en todos los casos. Por ejemplo, en conjuntos de
datos con distribuciones uniformes o cuando los datos están muy dispersos, la
moda puede no ser un valor representativo del conjunto en su totalidad.

Ejemplo: Supongamos que se recopilaron los siguientes datos sobre la


cantidad de hermanos que tienen los estudiantes de la maestría en Gestión
Pública:

Estudiante 1: 2 hermanos
Estudiante 2: 1 hermano
Estudiante 3: 3 hermanos
Estudiante 4: 2 hermanos
Estudiante 5: 1 hermano
Estudiante 6: 2 hermanos
Estudiante 7: 1 hermano
Estudiante 8: 4 hermanos

Para encontrar la moda en este conjunto de datos, identificamos el valor o


valores que ocurren con mayor frecuencia. En este caso, observamos que el
valor "2 hermanos" se repite más veces que cualquier otro valor. Por lo tanto, la
moda en este conjunto de datos es "2 hermanos".

Esto indica que la cantidad más común de hermanos entre los estudiantes de
la maestría es 2. Es importante destacar que puede haber más de una moda si
varios valores tienen la misma frecuencia máxima. Sin embargo, en este caso,
solo tenemos una moda única.

La moda es una medida de tendencia central útil para identificar los valores
más frecuentes o comunes en un conjunto de datos. En este ejemplo, nos
permite identificar la cantidad de hermanos más común entre los estudiantes
de la maestría.

TIPOS DE MODA:

3.1. Moda unimodal: cuando hay un solo valor que aparece con mayor
frecuencia en el conjunto de datos.
3.2. Moda bimodal: cuando hay dos valores que aparecen con la misma
mayor frecuencia en el conjunto de datos.

3.3. Moda multimodal: cuando hay más de dos valores que aparecen con la
misma mayor frecuencia en el conjunto de datos.

3.4. Moda sin moda: cuando no hay un valor que aparezca con mayor
frecuencia, es decir, todos los valores tienen la misma frecuencia.

En resumen, la moda es una medida de tendencia central que representa el


valor o valores más frecuentes en un conjunto de datos. Se calcula
encontrando el valor o valores con la mayor frecuencia. Es especialmente útil
para datos cualitativos o discretos y puede ser un indicador útil en ciertos
contextos, aunque no siempre proporciona una visión completa de la
distribución de los datos.3

4. LA MEDIA PONDERADA

La media ponderada es una medida de tendencia central que se calcula


asignando diferentes pesos a cada uno de los valores en un conjunto de datos.
Los pesos reflejan la importancia relativa de cada valor en el cálculo de la
media.

En la media ponderada, cada valor se multiplica por su peso correspondiente y


luego se suman los productos. A continuación, esta suma se divide entre la
suma total de los pesos. La fórmula general para calcular la media ponderada
es:

Media ponderada = (Valor1 * Peso1 + Valor2 * Peso2 + ... + ValorN * PesoN) /


(Peso1 + Peso2 + ... + PesoN)

Los pesos pueden ser cualquier valor numérico que represente la importancia
relativa de cada valor. Por ejemplo, si se desea calcular la calificación promedio
de un estudiante en un curso, se pueden asignar pesos a cada calificación en
función de la ponderación de cada evaluación (por ejemplo, un examen final
puede tener un peso mayor que una tarea).

La media ponderada es especialmente útil cuando se quiere tener en cuenta la


relevancia o la contribución relativa de cada valor en el cálculo de la medida de
tendencia central. Por ejemplo, en el caso de un análisis financiero, se pueden
asignar pesos a diferentes inversiones según su tamaño o rendimiento para
calcular una media ponderada de la tasa de retorno.

Es importante destacar que la media ponderada puede verse influenciada en


gran medida por los valores con pesos más altos. Si un valor tiene un peso
significativamente mayor que los demás, tendrá un impacto mayor en el cálculo
de la media ponderada.

Ejemplo: Supongamos que deseamos calcular la calificación promedio de un


estudiante del curso de Métodos Cuantitativos, y las calificaciones tienen
diferentes ponderaciones en función de su importancia en la evaluación final.
Aquí tienes un ejemplo de cómo se podría calcular la media ponderada:

3
(Paul Newbold, 2008)
Calificación del examen parcial 1: 14 (peso: 30%)
Calificación del examen parcial 2: 17 (peso: 40%)
Calificación del proyecto final: 19 (peso: 30%)

Para calcular la media ponderada, multiplicamos cada calificación por su


respectivo peso y luego sumamos los productos. Luego, dividimos esta suma
entre la suma total de los pesos.

Media ponderada = (14 * 0,3 + 17 * 0,4 + 19 * 0,3) / (0,3 + 0,4 + 0,3)


Media ponderada = (4,2 + 6,8 + 5,7) / 1
Media ponderada = 16,7

La media ponderada en este ejemplo es 16,7. Esto indica que la calificación


promedio del estudiante en el curso de Métodos Cuantitativos, teniendo en
cuenta las ponderaciones, es de 16,7. Los exámenes parciales 2 y el proyecto
final, que tienen pesos más altos, contribuyen más a la calificación promedio
que el examen parcial 1.

Es importante tener en cuenta que los pesos utilizados en la media ponderada deben
reflejar la importancia relativa de cada valor en el cálculo. Si los pesos no se asignan
adecuadamente, la media ponderada puede dar una imagen distorsionada de la
medida de tendencia central.

5. LA MEDIA GEOMÉTRICA

La media geométrica es una medida de tendencia central que se utiliza para


calcular el promedio de un conjunto de valores mediante el producto de dichos
valores. A diferencia de la media aritmética, que se calcula sumando los
valores y dividiendo entre la cantidad de valores, la media geométrica se
obtiene multiplicando los valores y luego calculando la raíz n-ésima del
producto, donde n es el número de valores en el conjunto.

La fórmula general para calcular la media geométrica es:

Media geométrica = (valor1 * valor2 * ... * valorN)^(1/N)

Donde valor1, valor2, ..., valorN representan los valores del conjunto y N es la
cantidad de valores.

La media geométrica es especialmente útil cuando se trabaja con valores que


tienen una relación multiplicativa, como tasas de crecimiento, rendimientos de
inversiones o factores de escala. También es útil cuando se desea calcular el
promedio de ratios o porcentajes.

Es importante tener en cuenta que la media geométrica puede verse


influenciada en gran medida por los valores más pequeños del conjunto. Un
valor extremadamente bajo puede hacer que la media geométrica sea
considerablemente más baja que la media aritmética correspondiente.

Ejemplo: Supongamos que un estudiante obtiene las siguientes calificaciones


en un curso:

Nota del primer examen: 15


Nota del segundo examen: 19
Nota del tercer examen: 13
Nota del cuarto examen: 17

Para calcular la media geométrica de estas notas, multiplicamos todos los


valores y luego calculamos la raíz cuarta del producto, ya que hay cuatro notas
en el conjunto.

Media geométrica = (15 * 19 * 13 * 17) ^ (1/4)

Calculando el producto de las notas:

Media geométrica = 62,985 ^ (1/4)

Evaluando la raíz cuarta:

Media geométrica ≈ 15.7

Por lo tanto, la media geométrica de las notas del alumno en el curso es


aproximadamente 15.7.

La media geométrica en este caso nos proporciona un valor promedio que tiene
en cuenta la relación multiplicativa de las calificaciones del estudiante. Es
importante tener en cuenta que la media geométrica puede verse influenciada
en gran medida por las notas más bajas, ya que el producto se ve afectado
significativamente por valores más pequeños.

En resumen, la media geométrica es una medida de tendencia central que se


obtiene multiplicando los valores del conjunto y calculando la raíz n-ésima del
producto. Es útil para calcular el promedio de valores con una relación
multiplicativa y puede ser especialmente aplicable en situaciones financieras o
de crecimiento.4

MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS


Las medidas de dispersión entregan información sobre la variación de la variable.
Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las
medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación
estándar, Coeficiente de variación.

6. RANGO DE VARIACIÓN
Se define como la diferencia entre el mayor valor de la variable y el menor valor de la
variable.

Rango de variación: VALOR MÁXIMO – VALOR MINIMO.

Por ejemplo: se realiza una encuesta sobre sus edades a 10 estudiantes de la


maestría en gestión pública en la escuela de postgrado de la Universidad Nacional de
la Amazonia Peruana, obteniendo las siguientes respuestas: 24, 35, 42, 23, 58, 62, 44,
56, 32, 29 años respectivamente. El rango para los datos obtenidos será el siguiente:
62 – 23: 39 años.

7. VARIANZA Y DESVIACIÓN ESTÁNDAR

4
(Fausto Francisco Matos Uribe, 2020)
La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz
cuadrada, la desviación estándar. La varianza se representa con el símbolo σ² (sigma
cuadrado) para el universo o población y con el símbolo s2 (s cuadrado), cuando se
trata de la muestra. La desviación estándar, que es la raíz cuadrada de la varianza, se
representa por σ (sigma) cuando pertenece al universo o población y por “s”, cuando
pertenece a la muestra. σ² y σ son parámetros, constantes para una población
particular; s2 y s son estadígrafos, valores que cambian de muestra en muestra dentro
de una misma población. La varianza se expresa en unidades de variable al cuadrado
y la desviación estándar simplemente en unidades de variable. Fórmulas
Donde µ es el promedio de la población.

σ ²=∑ ¿ ¿ ¿
i

Donde Ȳ es el promedio de la muestra.

s ²=∑ ¿ ¿ ¿
i

Consideremos a modo de ejemplo una muestra de 4 observaciones.


Según la fórmula el promedio calculado es 7, veamos ahora el cálculo de las medidas
de dispersión:
Tabla N° 01
Yi (Yi−Ῡ ) ¿
2 -5 25
6 -1 1
8 1 1
12 5 25
52

S2 = 52 / 3 = 17,33 Varianza de la muestra.


La desviación estándar de la muestra (s) será la raíz cuadrada de 17,33 = 4,16.
Interpretación de la varianza (válida también para la desviación estándar): un alto valor
de la varianza indica que los datos están alejados del promedio. Es difícil hacer una
interpretación de la varianza teniendo un solo valor de ella. La situación es más clara
si se comparan las varianzas de dos muestras, por ejemplo, varianza de la muestra
igual 13 y varianza de la muestra b igual 19. En este caso diremos que los datos de la
muestra b tienen mayor dispersión que los datos de la muestra a. esto significa que en
la muestra a los datos están más cerca del promedio y en cambio en la muestra b los
datos están más alejados del promedio.

8. COEFICIENTE DE VARIACIÓN
Es una medida de la dispersión relativa de los datos. Se define como la desviación
estándar de la muestra expresada como porcentaje de la media muestral.
s
CV = x 100

Es de particular utilidad para comparar la dispersión entre variables con distintas
unidades de medida. Esto porque el coeficiente de variación, a diferencia de la
desviación estándar, es independiente de la unidad de medida de la variable de
estudio.

MEDIDAS DE TENDENCIA CENTRAL EN DATOS AGRUPADOS


Se identifica como datos agrupados a los datos dispuestos en una distribución de
frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana, modo,
varianza y desviación estándar deben incluir una leve modificación.

9. PROMEDIO EN DATOS AGRUPADOS


La fórmula es la siguiente:
n

∑ Y i ni
i=1
Ῡ=
n
Donde ni representa cada una de las frecuencias correspondientes a los diferentes
valores de Yi. Consideremos como ejemplo una distribución de frecuencia de madres
que asisten a un programa de lactancia materna, clasificadas según el número de
partos. Por tratarse de una variable en escala discreta, las clases o categorías asumen
sólo ciertos valores: 1, 2, 3, 4, 5.

Tabla N° 02
Yi – N° de partos ni Yi x ni Ni (frecuencia acumulada
1 4 4 4
2 13 26 17
3 16 48 33
4 6 24 39
5 3 15 42
TOTAL 42 117

∑ Y i ni = 117/42 = 2.78
i=1
Ῡ=
n
Entonces las 42 madres han tenido, en promedio, 2,78 partos.
Si la variable de interés es de tipo continuo será necesario determinar, para cada
intervalo, un valor medio que lo represente. Este valor se llama marca de clase (Yc) y
se calcula dividiendo por 2 la suma de los límites reales del intervalo de clase. De ahí
en adelante se procede del mismo modo que en el ejercicio anterior, reemplazando, en
la fórmula de promedio, Yi por Yc.

10. MEDIANA EN DATOS AGRUPADOS


Si la variable es de tipo discreto la mediana será el valor de la variable que
corresponda a la frecuencia acumulada que supere inmediatamente a n/2.
En los datos de la tabla 02 Me=3, ya que 42/2 es igual a 21 y la frecuencia acumulada
que supera inmediatamente a 21 es 33, que corresponde a un valor de variable (Yi)
igual a 3.
Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia
acumulada que supere en forma inmediata a n/2, y luego aplicar la siguiente fórmula:

Me=Li+
n
2 [
−N i−1
Ai
]
ni

Li Límite inferior del intervalo de clase que contiene a la mediana.


n Tamaño de la muestra o frecuencia.
Ni-1 Frecuencia acumulada del intervalo anterior
A Amplitud del intervalo.

11. MODA EN DATOS AGRUPADOS


Si la variable es de tipo discreto la moda o modo será al valor de la variable (Yi) que
tenga la mayor frecuencia absoluta ( ). En los datos de la tabla 02 el valor de la moda
es 3 ya que este valor de variable corresponde a la mayor frecuencia absoluta =16.

ni−¿ n
Mo=Li+ i−1
¿
n i−¿ n i−1 +ni−¿n A i ¿
i +1
¿

Li Límite inferior del intervalo de clase que contiene a la mediana.


n Tamaño de la muestra o frecuencia.
A Amplitud del intervalo.

12. VARIANZA EN DATOS AGRUPADOS


Para el cálculo de varianza en datos agrupados se utiliza la fórmula

s ²=∑ ¿ ¿ ¿
i

Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2,78 partos por
madre,
Tabla N° 03
Yi – N° de ni Yi x ni Yi−Ῡ ¿
partos
1 4 4 3,1684 12,67
2 13 26 0,6084 7,9
3 16 48 0,0484 0,7744
4 6 24 1,4884 8,93
5 3 15 4,9284 14,7852
TOTAL 42 117 45,06

S2= 45,06/42-1= 45,06/41 = 1,1


Cuando los datos están agrupados en intervalos de clase, se trabaja con la marca de
clase (Yc), de tal modo que la fórmula queda:
s ²=∑ ¿ ¿ ¿
i

Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo:
Yc=(Límite inferior del intervalo + límite superior del intervalo)/2.

13. PERCENTILES

Los percentiles son valores de la variable que dividen la distribución en 100 partes
iguales. De este modo si el percentil 80 (P80) es igual a 35 años de edad, significa que
el 80% de los casos tiene edad igual o inferior a 35 años.

Su procedimiento de cálculo es relativamente simple en datos agrupados sin


intervalos. Retomemos el ejemplo de la variable número de partos:

Tabla N° 04
Yi – N° de ni Ni
partos
1 4 4
2 13 17
3 16 33
4 6 39
5 3 42
TOTAL 42

El percentil j (Pj) corresponde al valor de la variable (Yi) cuya frecuencia acumulada


supera inmediatamente al “j” % de los casos (jxn/100).

El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea
inmediatamente superior a 33,6 ((80x42) /100).

El primer Ni que supera a 33,6 es 39. Por lo tanto, al percentil 80 le corresponde el


valor 4. Se dice entonces que el percentil 80 es 4 partos (P80=4). Este resultado
significa que un 80% de las madres estudiadas han tenido 4 partos o menos.

Si los datos están agrupados en una tabla con intervalos, el procedimiento es


levemente más complejo ya que se hace necesaria la aplicación de una fórmula.

Pj=Li+
[
jn
100
−N i−1
Ai
]
ni

Se aplica a los datos del intervalo cuya frecuencia acumulada (Ni) sea inmediatamente
superior al “j” % de los casos (jxn/100).
En la siguiente tabla se muestra la distribución de 40 familias según su ingreso
mensual en miles de pesos. Nótese que para calcular el centro de clase se usaron los
límites reales de cada intervalo.

Ingreso ni Yc Ni x Yc Yc−Ῡ ¿ ¿ Ai Ni
familiar
80 – 99 8 90 720 -49,13 2413,76 19310,08 20 8
100 – 119 10 110 1100 -29,13 848,56 8485,6 20 18
120 – 159 11 140 1540 0,87 0,76 8,36 40 29
160 – 199 6 180 1080 40,87 1670,36 10022,16 40 35
200 – 249 5 225 1125 85,87 7373,66 36868,30 50 40
TOTAL 40 5565 74694,50

Ingreso promedio mensual: 5565/40=139,13

La mediana será:

Me=120+
40
2 [
−18
40
]
= 127,27.
11
El percentil 60 será:

[ 24−18 ]
P 60=120+ 40 = 141,81.
11
La varianza será: s2= 74694,50/39 = 1915.24
La desviación estándar es la raíz cuadrada de esta cifra, es decir: 43,76

USO DE PROGRAMA IBM SPSS STATISTICS

Se planteó el siguiente ejercicio:


El docente del curso métodos cuantitativos de la maestría en gestión pública dictado
en la Universidad Nacional de la Amazonia Peruana, calificó a sus estudiantes al
término de dicho curso, de los datos obtenidos quiere saber lo siguiente:
El promedio, la moda, la mediana, rango, varianza, desviación estándar, rango y
percentil 10.

Las calificaciones fueron las siguientes:


13,50 - 16,00 - 17,00 - 12,00 - 11,50 - 18,00 - 16,50 - 14,00 - 13,00 - 12,00 - 13,50 -
16,00 - 15,00 - 14,00 - 12,00 - 11,00 - 10,00 - 15,00 - 18,00 - 17,50.

Luego de introducir los datos en el programa IBM SPSS se obtuvo los siguientes
resultados:

Estadísticos
NOTAS
N Válido 20
Perdidos 0
Media 14,2750
Mediana 14,0000
Moda 12,00
Desv. Desviación 2,43589
Varianza 5,934
Rango 8,00
Suma 285,50
Percentiles 10 11,0500

Para ver el procedimiento que se siguió, revisar anexos.

Conclusiones
 Las medidas de tendencia central nos dan a conocer los valores más
representativos de un conjunto de datos.

 La mediana y la moda no se ven afectadas por los valores extremos, ya que


solo trabajan con los valores o datos centrales.

 La moda es la única medida que puede trabajar con variables de tipo


cualitativo, mientras que la media y mediana son aplicables solo para variables
cuantitativas.

 Dentro de las medidas de tendencia central la media es la más importante para


la mayoría de los estudios,
´

BIBLIOGRAFIA

1. Quevedo F. (02 de marzo del 2011) Medidas de tendencia central y dispersión.


Medwave 2011 doi: 10.5867/medwave.2011.03.4934
2. Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para
administración y economía. México D.F.: Cengage Learning Editores.
3. TOLEDO, I., & LÓPEZ ORTEGA Y BELLIDO, N. (2006). Manual de Estadística:
Descriptiva. Thompson.

ANEXOS

Como primer paso introducimos los datos obtenidos

Acto seguido procedimos a seleccionar la opción analizar y posteriormente la opción


estadísticos descriptivos.
A continuación, aparecerá una ventana con las opciones para seleccionar funciones y
variables.

Procedemos a seleccionar las funciones que necesitamos obtener


Finalmente seleccionamos “aceptar” y obtendremos los resultados requeridos.

También podría gustarte