Está en la página 1de 31

1.

TABLAS DE DISTRIBUCIÓN Y
REPRESENTACIONES GRÁFICAS

TEMA 1 – TABLAS DE FRECUENCIAS Y

REPRESENTACIONES GRÁFICAS
TABLAS DE FRECUENCIAS

A partir de las tablas de distribución de frecuencias, se proporcionará un conjunto de


herramientas o técnicas estadísticas para el tratamiento de la información, tanto cualitativa
como cuantitativa, que facilitan el manejo y análisis de los datos.

En la etapa de organización de los datos, nos referimos a la clasificación y tabulación de los


mismos. Por lo tanto, luego que los tenemos, se dividirá la información en clases
previamente definidas, en función de una o más características.

Un elemento cualquiera del conjunto de datos pertenecerá a una clase determinada, si


cumple con las características de esa clase. De lo contrario, pertenecerá a otra clase.

Cuando la división en clases se realiza en función de alguna característica


cualitativa, nos encontramos frente a datos cualitativos o atributos. Un
atributo es una cualidad que nos permite diferenciar los individuos u objetos
del conjunto según posean o no dicha cualidad. Ejemplo: sexo, estado civil,
profesión, color, etc.

Cuando la división en clases se realiza en función de alguna característica cuantitativa, nos


encontramos frente a datos cuantitativos o variables. Ejemplo: estatura, ingresos, cantidad
de miembros de una familia, cantidad de libros en préstamo, y los valores que pueden tomar
dependerá de la variable.

Lo expresado anteriormente nos conduce a diferenciar dos tipos de variables:

 Discretas : son aquellas variables que solo pueden tomar un conjunto finito de
valores, generalmente valores enteros. La cantidad de libros en préstamo es un caso típico
de variable discreta, pudiendo tomar los valores 0,1, 2, 3........n.

 Continuas : son aquellas variables que pueden tomar a priori un conjunto infinito de
valores. Generalmente son las magnitudes vinculadas a longitudes, superficies, volumen,
edad, duración o peso. Pero por razones de medición se discretizan y ese valor observable
representa un valor dentro de un intervalo teórico.
Distribuciones de frecuencias.

La distribución de frecuencias es la representación estructurada, en forma de tabla, de toda


la información que se ha recogido sobre la variable que se estudia.

Toda variable o atributo tiene asociada una distribución de frecuencias, que implica una
correspondencia biunívoca entre dos conjuntos. Por un lado, tenemos el conjunto formado
por los valores que toma la variable o el atributo y por el otro el de las frecuencias
relacionadas con ellos La asociación existe en ambos sentidos, pues a cada valor de la
variable o atributo, denominado clase, le corresponde una frecuencia y a su vez cada
frecuencia se identifica con una clase de la variable

Frecuencia absoluta y relativa.

 frecuencia absoluta : es la cantidad de datos que integran cada una de las clases, o
sea que son las repeticiones que encontramos dentro de una misma clase. La
correspondencia entre los valores de la variable y su frecuencia absoluta determina lo que
denominamos “distribución de frecuencias absolutas”

 frecuencia relativa : es la cantidad de repeticiones obtenidas para cada clase, en


relación al total de las observaciones. Resulta de dividir la cantidad de elementos de cada
clase (frecuencia absoluta) por el tamaño de la muestra. Las frecuencias relativas son un
porcentaje, ya que relacionan una parte del conjunto con el total La correspondencia
entre los valores de la variable y su frecuencia relativa determina lo que denominamos
“distribución de frecuencias relativas”

"Ejemplo de Tabla de Frecuencia de datos no agrupados"

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS CON DATOS NO AGRUPADOS.

La Tabla de frecuencia de datos no agrupados indica las frecuencias con que aparecen
los datos estadísticos sin que se haya hecho ninguna modificación al tamaño de las
unidades originales. En estas distribuciones cada dato mantiene su propia identidad
después que la distribución de frecuencia se ha elaborado. En estas distribuciones los
valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con
sus respectivas frecuencias.
La tabla de frecuencias de datos no agrupados se emplea si las variables toman un número
pequeños de valores o la variable es discreta.

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS

Cuando se tienen muchos datos cuantitativos y éstos se encuentran dispersos, es


conveniente formar grupos o intervalos para elaborar la Tabla de Frecuencias

y presentar la información.

La Tabla de frecuencia de datos agrupados aquella distribución en la que los datos


estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir,
los datos originales de varios valores adyacentes del conjunto se combinan para formar un
intervalo de clase.

A continuación aparecerán los pasos que se deben seguir para construir la tabla de
frecuencias.
 Determinar el número de intervalos a formar. Para hallarlo se utiliza la siguiente
ecuación: K= 1 + 3.32 log n. Dónde n corresponde al número total de datos que hay en la
muestra.

La selección del número adecuado de clases y los cortes entre ellas


es un asunto de criterio y de experiencia. Sin embargo, aquí se dan
unas reglas empíricas para calcular el número máximo de clases,
una de ellas es la de Sturges (1926) que establece que el número de
clases es K = 1 + log2 n = 1 + 3.322 log n, la cual subestima el
número de intervalos. Otra es la de Velleman (1976), K = ,
recomendada cuando n es pequeño (n £ 50) y otra es la de Dixon y
Kronmal (1965), K = 10 log n, para ngrande (n > 50). No se puede
establecer que una es superior a otra, sólo pueden utilizarse como
un punto de referencia. Cabe aclarar que se considera solamente la
parte entera que resulte del cálculo. En particular, los autores
hemos observado que para cualquier n, el número de intervalos o
clases que funciona bastante bien es .
 Determinar el rango de los datos. Es la diferencia entre el Dato Mayor (Xmax) y el
Dato Menor (Xmin). Rango= Xmax – Xmin
 Determinar la amplitud de los intervalos. Debe ser igual para todos los intervalos.
Es el cociente entre el rango y el número de intervalos. Amplitud= Rango/k El resultado
que se obtiene siempre se aproxima al entero superior. Por ejemplo si nos da 6.77
aproximamos a 7.

A continuación se presenta una tabla de distribución de frecuencias para datos agrupados.


ci fi Fi

[50, 60) 55 8 8

[60, 70) 65 10 18

[70, 80) 75 16 34

[80, 90) 85 14 48

[90, 100) 95 10 58

[100, 110) 110 5 63

[110, 120) 115 2 65

65

REPRESENTACIONES GRÁFICAS

Diagrama de barras
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos
de tipo discreto.
Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan losvalores
de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o
acumuladas.
Los datos se representan mediante barras de una altura proporcional a la frecuencia.

Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de
una clase para determinar su grupo sanguíneo ha dado el siguiente resultado:
Grupo
fi
sanguíneo

A 6

B 4

AB 1

0 9

20

Polígonos de frecuencia
Un polígono de frecuencias se forma uniendo los extremos de
las barras mediantesegmentos.
También se puede realizar trazando los puntos que representan las frecuencias y
uniéndolos mediante segmentos.

Ejemplo
Las temperaturas en una ciudad han sufrido las siguientes variaciones:
Hora Temperatura

6 7º

9 12°

12 14°

15 11°

18 12°

21 10°

24 8°
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa
frecuentemente para las variables cualitativas.

Los datos se representan en un círculo, de modo que el ángulo de


cada sector esproporcional a la frecuencia absoluta correspondiente.

El diagrama circular se construye con la ayuda de un transportador de ángulos.


Ejemplo

En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al


fútbol y el resto no practica ningún deporte.

Alumnos Ángulo

Baloncesto 12 144°

Natación 3 36°

Fútbol 9 108°

Sin deporte 6 72°

Total 30 360°

Un histograma es una representación gráfica de una variable en forma de barras.


Se utilizan para variables continuas o para variables discretas, con un gran número de
datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del
intervalo, y por altura, la frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de los valoresrepresentados.

Polígono de frecuencia
Para construir el polígono de frecuencia se toma la marca de clase que coincide con
el punto medio de cada rectángulo.

Ejemplo

El peso de 65 personas adultas viene dado por la siguiente tabla:


ci fi Fi

[50, 60) 55 8 8

[60, 70) 65 10 18

[70, 80) 75 16 34

[80, 90) 85 14 48

[90, 100) 95 10 58

[100, 110) 110 5 63

[110, 120) 115 2 65

65
Histograma y polígono de frecuencias acumuladas
Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene
el histograma de frecuencias acumuladas o su correspondiente polígono.
Histogramas con intervalos de amplitud diferente
Para construir un histogramas con intervalo de amplitud diferente tenemos
que calcular las alturas de los rectángulos del histograma.

hi es la altura del intervalo.


fi es la frecuencia del intervalo.
ai es la amplitud del intervalo.

Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y
sobresaliente) obtenidas por un grupo de 50 alumnos.
fi hi

[0, 5) 15 3

[5, 7) 20 10

[7, 9) 12 6

[9, 10) 3 3

50
Publicado por SAMUEL A. CASTILLO R. en 16:02

Medidas de tendencia central


Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la
información con un solo número. Este número que, para tal fin, suele situarse hacia el centro
de la distribución de datos se denomina medida o parámetro de tendencia central o de
centralización. Cuando se hace referencia únicamente a la posición de estos parámetros
dentro de la distribución, independientemente de que ésta esté más o menos centrada, se
habla de estas medidas como medidas de posición.1 En este caso se incluyen también
los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:

 Media aritmética
 Media ponderada
 Media geométrica
 Media armónica
 Mediana
 Moda
Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que
las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable
que se está observando, en este caso se observan variables cuantitativas.

La media aritmética[editar]
Artículo principal: Media aritmética

La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el
número de sumadores.

Por ejemplo, las notas de 5 alumnos en una prueba:


niño nota
1 6,0 ·Primero, se suman las notas:
2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6
3 3,1 ·Luego el total se divide entre la cantidad de
alumnos:
4 7,0 27,6/5=5,52
5 6,1

· La media aritmética en este ejemplo es 5,52

La media aritmética es, probablemente, uno de los parámetros estadísticos más


extendidos.2 Se le llama también promedio o, simplemente, media.

Definición formal[editar]
Dado un conjunto numérico de datos, x1, x2, ..., xn, se define su media aritmética como

Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas,


esto es, también puede calcularse para variables agrupadas en intervalos.

Propiedades[editar]
Las principales propiedades de la media aritmética son:3

 Su cálculo es muy sencillo y en él intervienen todos los datos.

 Su valor es único para una serie de datos dada.

 Se usa con frecuencia para comparar poblaciones, aunque es más apropiado


acompañarla de una medida de dispersión.

 Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya


que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su
propio valor:

 Minimiza las desviaciones cuadráticas de los datos respecto de cualquier valor

prefijado, esto es, el valor de es mínimo cuando . Este


resultado se conoce como Teorema de König. Esta propiedad permite interpretar
uno de los parámetros de dispersión más importantes: la varianza.

 Se ve afectada por transformaciones afines (cambios de origen y escala), esto es,


si
entonces , donde es la media aritmética de los ,
para i = 1, ..., n y a y b números reales.

 Es poco sensible a fluctuaciones muestrales, por lo que es un parámetro muy


útil en inferencia estadística.
Inconvenientes de su uso[editar]
Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en
situaciones muy diversas, tiene también algunos inconvenientes, como son:

 Para datos agrupados en intervalos (variables continuas) su valor oscila en


función de la cantidad y amplitud de los intervalos que se consideren.

La estatura media como resumen de una población homogénea (abajo) o heterogénea


(arriba).

 Es una medida a cuyo significado afecta sobremanera la dispersión, de modo


que cuanto menos homogéneos sean los datos, menos información
proporciona. Dicho de otro modo, poblaciones muy distintas en su
composición pueden tener la misma media.4 Por ejemplo, un equipo de
baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente,
tendría una estatura media de 1,95 m, valor que representa fielmente a esta
población homogénea. Sin embargo, un equipo de jugadores de estaturas
más heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo,
tendría también, como puede comprobarse, una estatura media de 1,95 m,
valor que no representa a casi ninguno de sus componentes.

 En el cálculo de la media no todos los valores contribuyen de la misma


manera. Los valores altos tienen más peso que los valores cercanos a cero.
Por ejemplo, en el cálculo del salario medio de una empresa, el salario de un
alto directivo que gane 10.000 € tiene tanto peso como el de diez empleados
"normales" que ganen 1.000 €. En otras palabras, se ve muy afectada por
valores extremos.

 No se puede determinar si en una distribución de frecuencias hay intervalos


de clase abiertos.
Media aritmética ponderada[editar]
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una media
ponderada.

Si son nuestros datos y son sus "pesos"


respectivos, la media ponderada se define de la siguiente forma:

Media muestral[editar]
Esencialmente, la media muestral es el mismo parámetro que el anterior,
aunque el adjetivo "muestral" se aplica a aquellas situaciones en las que la
media aritmética se calcula para un subconjunto de la población objeto de
estudio.

La media muestral es un parámetro de extrema importancia en la inferencia


estadística, siendo de gran utilidad para la estimación de la media
poblacional, entre otros usos.

Moda[editar]
Artículo principal: Moda (estadística)

La moda es el dato más repetido de la encuesta, el valor de la variable con


mayor frecuencia absoluta.5 En cierto sentido la definición matemática
corresponde con la locución "estar de moda", esto es, ser lo que más se lleva.
Su cálculo es extremadamente sencillo, pues solo necesita un recuento. En
variables continuas, expresadas en intervalos, existe el denominado intervalo
modal o, en su defecto, si es necesario obtener un valor concreto de la
variable, se recurre a la interpolación.

Por ejemplo, el número de personas en distintos vehículos en una carretera:


5-7-4-6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es
5.

Hablaremos de una distribución bimodal de los datos, cuando encontremos


dos modas, es decir, dos datos que tengan la misma frecuencia absoluta
máxima. Cuando en una distribución de datos se encuentran tres o más
modas, entonces es multimodal. Por último, si todas las variables tienen la
misma frecuencia diremos que no hay moda.

Cuando tratamos con datos agrupados en intervalos, antes de calcular la


moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor
frecuencia absoluta.

La moda, cuando los datos están agrupados, es un punto que divide el


intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del
intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal y y las


frecuencias absolutas de los intervalos anterior y posterior,
respectivamente, al intervalo modal.

Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una


clase viene dada por la siguiente tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 8 9 3 4 2

Propiedades[editar]
Sus principales propiedades son:

 Cálculo sencillo.
 Interpretación muy clara.
 Al depender solo de las frecuencias, puede calcularse para variables
cualitativas. Es por ello el parámetro más utilizado cuando al resumir
una población no es posible realizar otros cálculos, por ejemplo,
cuando se enumeran en medios periodísticos las características más
frecuentes de determinado sector social. Esto se conoce
informalmente como "retrato robot".6
Inconvenientes[editar]

 Su valor es independiente de la mayor parte de los datos, lo que la


hace muy sensible a variaciones muestrales. Por otra parte, en
variables agrupadas en intervalos, su valor depende excesivamente
del número de intervalos y de su amplitud.
 Usa muy pocas observaciones, de tal modo que grandes variaciones
en los datos fuera de la moda, no afectan en modo alguno a su valor.
 No siempre se sitúa hacia el centro de la distribución.
 Puede haber más de una moda en el caso en que dos o más valores
de la variable presenten la misma frecuencia (distribuciones
bimodales o multimodales).

Mediana[editar]
Artículo principal: Mediana (estadística)

La mediana es un valor de la variable que deja por debajo de sí a la mitad


de los datos, una vez que éstos están ordenados de menor a mayor.7 Por
ejemplo, la mediana del número de hijos de un conjunto de trece familias,
cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2,
puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3,
4, el que ocupa la posición central es 2:

En caso de un número par de datos, la mediana no correspondería a


ningún valor de la variable, por lo que se conviene en tomar como
mediana el valor intermedio entre los dos valores centrales. Por
ejemplo, en el caso de doce datos como los siguientes:

Se toma como mediana


Existen métodos de cálculo más rápidos para datos más
numerosos (véase el artículo principal dedicado a este
parámetro). Del mismo modo, para valores agrupados en
intervalos, se halla el "intervalo mediano" y, dentro de éste, se
obtiene un valor concreto por interpolación.

Cálculo de la mediana para datos


agrupados[editar]
Primero hallamos las frecuencias absolutas acumuladas Fi (ver
tabla del margen derecho).

Así, aplicando la fórmula asociada a la mediana para n impar,


obtenemos X(39+1)/2 = X20 y basándonos en la fórmula que
hace referencia a las frecuencias absolutas:

Ni-1< n/2 < i = N19 < 19.5 < N20

Por tanto la mediana será el valor de la variable que ocupe el


vigésimo lugar. En nuestro ejemplo, 21 (frecuencia absoluta
acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es
aconsejable no olvidar las unidades; en este caso como
estamos hablando de calificaciones, serán puntos)

La mitad de la clase ha obtenido un 5 o menos, y la otra


mitad un 5 o más.

Ejemplo (N par)

Las calificaciones en la asignatura de Matemáticas de 38


alumnos de una clase viene dada por la siguiente tabla
(debajo):

Calificaciones 1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 6 9 4 4 2
Cálculo de la xi fi Fi
Mediana:
1 2 2
Primero
2 2 4
hallamos las
frecuencias 3 4 8
absolutas
4 5 13
acumuladas F
5 6 19 = 19
i (ver tabla
margen 6 9 28
derecho).
7 4 32
Si volvemos a
8 4 36
utilizar la
fórmula 9 2 38
asociada a la
mediana para n par, obtenemos X(38/2) = X19 y basándonos
en la fórmula que hace referencia a las frecuencias absolutas
--> Ni-1< n/2 < Ni = N18 < 19 < N19

Con lo cual la mediana será la media aritmética de los


valores de la variable que ocupen el decimonoveno y el
vigésimo lugar.

En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el


vigésimo el 6, (desde el vigésimo hasta el vigésimo octavo)

con lo que Me = (5+6)/2 = 5,5 puntos.

Propiedades e inconvenientes[editar]
Las principales propiedades de la mediana son:8

 Es menos sensible que la media a oscilaciones de los


valores de la variable. Un error de transcripción en la
serie del ejemplo anterior en, pongamos por caso, el
último número, deja a la mediana inalterada.
 Como se ha comentado, puede calcularse para datos
agrupados en intervalos, incluso cuando alguno de ellos
no está acotado.
 No se ve afectada por la dispersión. De hecho, es más
representativa que la media aritmética cuando la
población es bastante heterogénea. Suele darse esta
circunstancia cuando se resume la información sobre los
salarios de un país o una empresa. Hay unos pocos
salarios muy altos que elevan la media aritmética
haciendo que pierda representatividad respecto al grueso
de la población. Sin embargo, alguien con el salario
"mediano" sabría que hay tanta gente que gana más
dinero que él, como que gana menos.

Sus principales inconvenientes son que en el caso de datos


agrupados en intervalos, su valor varía en función de la
amplitud de estos. Por otra parte, no se presta a cálculos
algebraicos tan bien como la media aritmética.

Buscar


A
 B
 C
 D
 E
 F
 G
 H
 I
 J
 K
 L
 M
 N
 O
 P
 Q
 R
 S
 T
 U
 V
 W
 Y
 Z

Medidas de de tendencia central

La med i d as d e cen t ral i zaci ón nos i ndi can en t orno a qu é


val or (c ent ro) se di s t ri bu yen l os dat os.

La med i d as d e cen t ral i zaci ón son:

Moda

La mod a es el val or que t i ene mayor f r ecu en ci a ab sol u ta .

S e repres ent a por M o .

S e puede hal l ar l a mod a para vari ab l es


cu al i tati vas y cu an ti tati vas .

H al l ar l a mod a de l a di st ri buci ón:

2, 3, 3, 4, 4, 4, 5, 5 M o = 4

S i en un grupo h a y d os o vari as p u n tuaci on es con l a mi s ma


f recu en ci a y esa f re cuenci a es l a m áx i m a,
l a d i stri b u ci ón es bi mod al o mu l ti mod al , es deci r, t i ene v ari as
mod as .

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 M o = 1, 5, 9
C uando t odas l as p u n tu aci on es de un grupo t i enen l a mi sma
f recu en ci a , n o ha y mod a .

2, 2, 3, 3, 6, 6, 9, 9

S i d os pu n tu aci on es ad yacen tes t i enen l a f recu en ci a


máxi ma , l a mod a es el p romed i o de l as dos punt uaci ones
ad ya c ent es.

0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

Cálculo de la moda para datos agrupados

1º Todos los intervalos tienen la misma amplitud.

L i es el l í m i t e i nferi or de l a cl as e m odal .

f i es l a frecuenci a a bsol ut a de l a cl ase m odal .

f i - - 1 es l a frecuenci a absol ut a i nm edi at a m ent e i nferi or a l a


en cl ase m odal .

f i - + 1 es l a frecu enci a absol ut a i nm edi at a m ent e post eri or a l a


cl ase m odal .

a i es l a am pl i t ud de l a cl ase.
Tam bi én se ut i l i z a ot ra f órmu l a de l a mod a que da un val or
ap roxi mad o de ést a :

Ejemplo

Cal cu l ar l a mod a de una di st ri buci ón e st adí st i ca que vi ene


dada por l a si gui ent e t abl a:

fi

[60, 63) 5

[63, 66) 18

[66, 69) 42

[69, 72) 27

[72, 75) 8

100
2º Los intervalos tienen amplitudes distintas.

En pri m er l ugar t en em os que hal l ar l as al t uras.

La cl ase m od al es l a que t i ene m a yor al t ura.

La f ór mu l a de l a m od a ap roxi mad a cu ando ex i st en


di s t i nt as am pl i t udes es:

Ejemplo

En l a si gui ent e t abl a se m uest ra l as cal i fi caci ones


(s uspenso, aprob ado , not abl e y sob resal i ent e) obt eni das por un
grupo d e 50 al um no s. Cal cu l ar l a mod a .
fi hi

[0, 5) 15 3

[5, 7) 20 10

[7, 9) 12 6

[9, 10) 3 3

50

Mediana

Es el val or que ocu pa el l u gar cen tral de t odos


l os d atos cuando ést os est án ord en ad os d e men or a mayor .

La med i an a se rep r esent a por M e .


La med i an a se puede h al l ar sól o para vari ab l es
cu an ti tati vas .

Cálculo de la mediana

1 O rd en amos l os d atos de men or a ma yor .

2 S i l a seri e t i ene un n ú mero i mp ar d e


med i d as l a med i an a es l a p u n tu aci ón cen tral de l a m i sm a .

2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5

3 S i l a seri e t i ene un n ú mero p ar d e pu nt uaci ones


l a med i an a es l a me d i a ent re l as dos p u n tu aci on es cen tral e s .

7, 8, 9, 10, 11, 12 Me= 9.5

Cálculo de la mediana para datos agrupados

La med i an a se encu ent ra en el i n terval o donde


l a f recu en ci a acu mu l ad a l l ega hast a l a mi tad d e l a su ma d e l as
f recu en ci as ab sol u tas .

Es deci r t enem os qu e buscar el i nt erval o en el que se


encuent r e .
L i es el l í m i t e i nferi or de l a cl ase donde se encuent ra l a
m edi ana.

es l a sem i sum a de l as fre cuenci as absol ut as.

F i - 1 es l a f recu en ci a acu mu l ad a ant eri or a l a cl ase m edi ana.

a i es l a am pl i t ud de l a cl ase.

La med i an a es i n d ep en d i en te de l as a mp l i tu d es de
l os i n terval os .

Ejemplo

Cal cu l ar l a med i an a de una di st ri buci ó n est adí st i ca que


vi ene dada po r l a si gui ent e t abl a:

fi Fi

[60, 63) 5 5

[63, 66) 18 23

[66, 69) 42 65

[69, 72) 27 92
[72, 75) 8 100

100

100 / 2 = 50

C l ase m odal : [ 66, 69)

Media aritmética

La med i a ari t méti c a es el val or obt eni do al su mar t odos


l os d atos y d i vi d i r el resul t ado ent r e el n ú mero t ot al de d at os .

es el sí m bol o de l a med i a ari t mé ti ca .

Ejemplo
Los pesos de sei s am i gos son: 84, 91, 72, 68, 87 y 78 kg.
Hal l ar el peso m edi o.

Media aritmética para datos agrupados

S i l os d atos vi enen agru p ad os en una t abl a de f recu enci as,


l a ex presi ón de l a med i a es:

Ejercicio de media aritmética

En un t est real i z ado a un grupo de 42 p e rsonas se han


obt eni do l as punt uaci ones que m uest ra l a t abl a. Cal cu l a l a
p u n tu aci ón med i a .

xi fi xi · fi

[10, 20) 15 1 15
[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

[60,70) 65 4 260

[70, 80) 75 2 150

42 1 820

Propiedades de la media aritmética

1 La su ma de l as d esvi aci on es de t odas l as punt uaci ones de


una di st ri buci ón res pect o a l a med i a de l a m i sm a i gual a ce r o .

Las sum a de l as des vi aci ones de l os nú m eros 8, 3, 5, 12, 10


de su m edi a ari t m ét i ca 7.6 es i gual a 0:
8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =

= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0

2 La med i a ari t mé t i ca de l os cu ad rad os de


l as d esvi aci on e s de l os val ores de l a va r i abl e con resp ect o a
u n n ú mero cual qui e ra se ha ce mí n i ma c uando
di cho n ú me ro coi nc i de con l a med i a ari t méti ca .

3 S i a t odos l os valores de l a v ari abl e s e l es su ma un


m i sm o n ú mero , l a med i a ari t mé ti ca qu eda au men tad a en
di cho n ú me ro .

4 S i t odos l os val ores de l a va ri abl e se mu l ti p l i can por un


m i sm o n ú mero l a med i a ari t méti ca qu e da mu l ti p l i cad a por
di cho n ú me ro .

Observaciones sobre la media aritmética

1 La med i a se pued e h al l ar sól o para v ari ab l es


cu an ti tati vas .

2 La med i a es i n d ep en d i en te de l as a mp l i tu d es de
l os i n terval os .
3 La med i a es m uy sensi bl e a l as p u n tu aci on es extremas .
S i t enem os una di st ri buci ón con l os si gu i ent es pesos:

65 kg, 69k g , 65 k g, 72 kg, 66 k g, 75 k g, 70 kg, 110 k g.

La med i a es i gual a 74 kg, que es una med i d a d e


cen tral i zaci ón poco repres ent at i va de l a di st ri buci ón.

4 La med i a no se p uede c al cul ar si ha y un i nt erval o con


u n a a mp l i tu d i nd eter mi n ad a .

xi fi

[60, 63) 61.5 5

[63, 66) 64.5 18

[66, 69) 67.5 42

[69, 72) 70.5 27

[72, ∞ ) 8

100
En est e caso no es posi bl e hal l ar l a med i a porque no
podem os cal cul a r l a ma rca d e cl as e de úl t i m o i nt erval o.

También podría gustarte