Está en la página 1de 11

Docente: Bélgica Rodríguez Núñez

REPRESENTACIÓN DE DATOS EN TABLAS Y GRÁFICOS

La recopilación de datos de un estudio estadístico se presenta mediante


una tabla (o gráfico) de distribución de frecuencias. En ellas se representan
los valores de los datos asociados a su frecuencia absoluta, frecuencia
relativa o frecuencia porcentual.

Por ejemplo, la tabla adjunta representa la distribución de frecuencias de


las edades de los participantes en el taller de .música de un colegio.

Edad (años) Frecuencia


14 4
15 7
16 6
17 8

Sumando la columna de frecuencias se obtiene la cantidad de datos


(número de alumnos que participan en el taller), que son:
(4 +7 + 6 + 8) = 25 alumnos. Luego, es posible determinar las columnas de
frecuencia relativa y de frecuencia porcentual:

Edad Frecuencia Frecuencia Frecuencia


(años) relativa porcentual
14 4 0,16 16%
15 7 0,28 28%
16 6 0,24 24%
17 8 0,32 32%

Además, se pueden determinar las frecuencias acumuladas de cada


valor, que corresponde a la suma de frecuencias desde el primer valor de la
muestra hasta el valor indicado:

Edad Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


(años) acumulada relativa relativa porcentual Porcentual
acumulada acumulada
14 4 4 0,16 0,16 16% 16%
15 7 11 0,28 0,44 28% 44%
16 6 17 0,24 0,68 24% 68%
17 8 25 0,32 1 32% 100%

Gráficamente, existen varias representaciones de distribuciones de


frecuencias. Por ejemplo:
- Gráfico de barras...
- Polígono de frecuencias
- Gráfico circular. ( el área de cada sector es proporcional a la
frecuencia relativa o porcentual del valor que represente)
- Histograma, entre otros.
En el caso de que los valores estén agrupados, es posible construir los
mismos gráficos. En el gráfico de barras se representan los límites de
cada intervalo, por lo cual las barras están necesariamente unidas.
Todos los intervalos contienen al límite inferior, pero no al límite
superior, excepto el último que incluye a ambos.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS

Las medidas de tendencia central son valores numéricos que localizan, de


alguna manera, el centro de un conjunto de datos. El término promedio a menudo
es asociado con todas las medidas de tendencia central.

Estas son tres:

1) Media o Media Aritmética: Es el promedio, que quizás sea el más


conocido. Se representa por x (que se lee como “x barra” o “media de la
muestra”)
La media se encuentra sumando todos los valores de la variable x. (la suma
de valores se simboliza como  x ) y dividiendo por el número de estos
valores n . Lo anterior se expresa con la siguiente fórmula:

Media de la muestra: x
x
n

Ejemplo:

Un conjunto de datos consta de cinco valores : 6, 3, 8, 6 y 4. Encuentre la


media.

Solución: Al aplicar la fórmula anterior, resulta:

x
 x  6  3  8  6  4  27  5,4
n 5 5

En consecuencia, la media de esta muestra es 5,4.

2) Mediana: Valor de los datos que ocupa la posición central cuando los datos
se ordenan según su tamaño. (preferentemente de menor a mayor)
Se representa por : Me.
Procedimiento para encontrar la mediana:
Paso 1: Ordene los datos.
Paso 2: Determine la profundidad de la mediana.
La profundidad de la mediana (número de posiciones a partir de
cualquier extremo), o posición, de la mediana se determina con la siguiente
fórmula:
número  1
Profundidad de la mediana =
2
La profundidad o posición de la mediana se encuentra al sumar los
números de posición de los valores de los datos más pequeños (1) y los
más grandes (n) y dividir el resultado por 2.(n es el mismo número de que la
cantidad de porciones de los datos .)
Paso 3: Determine el valor de la mediana.
Contar los datos ordenados, localizando el dato que está en la profundidad
de la mediana.
La mediana será la misma sin importar a partir de cuál extremo de los datos
(máximo o mínimo) ordenados se cuente.
Los siguientes ejemplos muestran cómo determinar la Me:
Ejemplo 1: Encontrar la mediana del conjunto de datos 6,3,8.5.3
Solución:
Paso 1: Los datos, ordenados de manera creciente son: 3, 3, 5, 6 y 8.
Paso 2:
n 1 5 1
Profundidad de la mediana:  3
2 2
Paso 3: Es decir, la mediana es el tercer número desde cualquier extremo
en los datos ordenados. Observa que la mediana esencialmente separa el
conjunto de datos en dos subconjuntos de igual tamaño.

Ejemplo 2: Encontrar la mediana de la muestra: 9, 6, 7, 9, 10 y 8.


Solución:
Paso 1: Los datos, ordenados de manera creciente, son: 6, 7, 8, 9, 9, 10
n 1 6 1
Paso 2: Profundidad de la mediana:   3,5
2 2
Paso 3: Es decir, la mediana está a la mitad entre las posiciones de datos
tercera y cuarta. Para encontrar el número situado a la mitad de dos valores
cualesquiera, se suman dichos valores y el resultado se divide por 2. En
este caso, se suman el tercer valor (8) y el cuarto valor (9); luego se divide
por 2.
89
Entonces, la mediana es: Me   8,5 , número que está al medio de
2
estos dos números.
Observa que de nuevo la mediana separa el conjunto de datos ordenados
en dos subconjuntos del mismo tamaño.

3) Moda: El valor de x que ocurre más frecuentemente. (el que más se repite
en la muestra)

Ejemplo 1: En el conjunto de datos: 3, 3, 5, 6, 8; la moda es 3 .

Ejemplo 2: En el conjunto da la muestra 6, 7, 8, 9, 9, 10, la moda es 9. Es


decir, sólo el 9 aparece más de una vez.

4) Rango Medio: Número que está exactamente a la mitad del camino entre
un dato con menor valor Mín y un dato con mayor valor Máx . Se encuentra
promediando los valores mínimo y máximo.
Entonces:
valor..mìnimo  valor..máximo
Valor Medio 
2

Mín  Máx
Valor Medio 
2
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

Observa los puntajes obtenidos por los estudiantes de un curso en una


prueba de diagnóstico:

Puntaje xi = Mc fi Fi
0,10 2
10,20 6
20,30 21
30,40 11
Total

- Completa la tabla con la marca de clase (Mc) de cada intervalo y la


frecuencia acumulada (Fi)
- ¿Cuántos estudiantes rindieron la prueba?
- ¿Cuál es el intervalo con mayor frecuencia absoluta?

1) La media aritmética ( x ) para datos agrupados en intervalos se


calcula utilizando la expresión:
N

x  f  x 2  f 2  x3  f 3  ...  x N  f N x
i 1
i  fi
x 1 1 = , en donde:
n n

x i : marca de clase del i-ésimo intervalo.

f i : Frecuencia absoluta del i-ésimo intervalo.

n : Número total de datos de la muestra.

N : Cantidad de intervalos.

2) Para calcular la moda (Mo) de datos agrupados en intervalos se


utiliza la expresión:

 fa 
M o  a  b  a     ; en donde:
 f a  f s 

a,b : Intervalo modal: intervalo de mayor frecuencia absoluta (f).


fa : Diferencia entre la frecuencia absoluta del intervalo modal y la
frecuencia del intervalo anterior.
fs : Diferencia entre la frecuencia absoluta del intervalo modal y la
frecuencia del intervalo siguiente.
3) Para calcular la mediana (Me) de datos agrupados en intervalos se
utiliza la expresión:

n 
  Fa 
M e  a  b  a    2  ; en donde:
 f 
 
 

n: número total de datos.

a,b : primer intervalo donde la frecuencia acumulada (F) es mayor o


n
Igual que .
2
Fa : frecuencia acumulada anterior al intervalo a, b .
f : frecuencia absoluta del intervalo a, b .

Ejemplo:

En el caso de los puntajes en la prueba de diagnóstico, se tiene que:

- x = 25,25 puntos
- M o = 26 puntos
- Me  25,7 puntos

Actividades:
1) Analiza las siguientes situaciones y luego responde:

a) Se midió la estatura de un grupo de niños y niñas de un jardín


infantil. Los datos se muestran en la tabla.

Estatura(cm) f
80  84 7
84  88 8
88  92 15
92  96 12
96  100 8
Total

- ¿Cuál es el promedio de las estaturas?


- ¿Cuál es la mediana y la moda de las estaturas?
MEDIDAS DE DISPERSIÓN

Una vez localizado el “centro” con las medidas de tendencia central, la


investigación en busca de información a partir de los conjuntos de datos
se dirige ahora a las medidas de dispersión.

Las medidas de dispersión incluyen el: Rango, la varianza y la


desviación estándar.

Estos valores numéricos describen la cantidad de dispersión, o


variabilidad, que se encuentra entre los datos: Datos bastante
agrupados poseen valores relativamente pequeños, y datos más
dispersos tienen valores más grandes. El agrupamiento más estrecho
ocurre cuando los datos carecen de dispersión (todos los datos tienen el
mismo valor), para los cuales la medida de dispersión es cero. No hay
límite respecto a cuán dispersos pueden ser los datos; en consecuencia,
las medidas de dispersión pueden ser muy grandes.

1) Rango: Es la diferencia en valor entre las posiciones de datos de


mayor valor ( Máx ) y de menor valor ( Mín ).

Rango = Máximo Mínimo

Rango  Máx  Mín

Ejemplo: El rango de la muestra: 3, 3, 5, 6, 8 es:

Rango =  Máx  Mín  8  3  5

El rango 5 indica que todos estos valores caen en un intervalo de 5 unidades.

Las otras medidas de dispersión que estudiaremos son medidas de dispersión


con respecto a la media. Para obtener una medida de dispersión con respecto a la
media primero se contestará la pregunta: “¿cuán lejos está cada x de la media?”

Desviación con respecto a la media

Una desviación de la media, x  x , es la diferencia entre el valor x y la


media x .

Cada valor individual x se desvía de la media por una cantidad igual a


( x  x) . Esta desviación ( x  x) es cero cuando x es igual a la media x .
La desviación ( x  x) es positiva si x es mayor que x y negativa si x es
menor que x .

Ejemplo: Considera la muestra: 6, 3, 8, 5, 3. Al usar la fórmula x 


x ,
n
se encuentra que la media es 5. Luego, cada desviación, ( x  x) , se
encuentra restando 5 de cada valor x .
Datos x 6 3 8 5 3
Desviación xx 1 -2 3 0 -2

Para describir el valor “promedio” de estas desviaciones podría usarse

la desviación media, la suma de desviaciones dividida entre n ,


 x  x
n
Sin embargo, como la suma de las desviaciones,  x  x , es
exactamente cero, la desviación media también es cero. De hecho,
siempre será cero.

Debido a que la desviación media siempre es igual a cero, no es un


estadístico de utilidad.

La suma de las desviaciones  x  x , siempre es cero debido al


efecto de neutralización entre las desviaciones de los valores x
menores que la media (que son negativos) y los valores x mayores que
la media (que son positivos). Este efecto de neutralización puede
eliminarse si se hace algo para que todas las desviaciones sean
positivas.

Una forma de eliminar el efecto de neutralización positivo-negativo es


elevar al cuadrado cada una de las desviaciones; todas las desviaciones
al cuadrado serán valores no negativos (positivos o cero). Las
desviaciones al cuadrado se utilizan para determinar la varianza.

Varianza de la muestra

La varianza de la muestra, s 2 , es la media de las desviaciones al


cuadrado, calculada usando como divisor a n  1 .

sumade(desviaciones) 2
Varianza de la muestra: s2 
número  1

 x  x 
2

s 2

n 1
Donde n es el tamaño de la muestra, es decir, el número de datos que
hay en la muestra.

Ejemplo: La varianza de la muestra : 6, 3, 8, 5, 3 se calcula mediante


los siguientes pasos:
Paso 1: Se encuentra la  x  6  3  8  5  3  25

Paso 2: Se encuentra x 
 x  25  5
n 5
Paso 3: Se encuentra cada x  x : 6 - 5 = 1
3–5=-2
8–5= 3
5- 5= 0
3–5=-2

Comprobación:  x  x  0

 x  x 12
2
Paso 4: Se encuentra : 1

 22  4
32  9
0 2  0
 22  4
18

 x  x
2
18
Paso 5: Varianza de la muestra = s 2
   4,5
n 1 4

Ejercicio: Encontrar la varianza de la muestra 1,3,5,6,10

Desviación Estándar

La desviación estándar de una muestra, s , es la raíz cuadrada positiva de la


varianza:
Desviación estándar de una muestra: s  s 2 .

En el ejemplo analizado anteriormente, la desviación estándar es: 4,5 ó 2,1.

Observaciones Importantes:

La desviación estándar de un conjunto es cero solo si todos los elementos del


conjunto tienen el mismo valor, y va aumentando en la medida que aumenta la
diferencia entre los valores de los datos. Además, si un conjunto tiene una
desviación estándar σ, entonces se cumple que:

- Si a todos los datos del conjunto se les suma o se les resta la misma cantidad,
entonces la desviación estándar del conjunto continúa siendo σ.

- Si todos los datos del conjunto se multiplican por un factor k, entonces la


desviación estándar del conjunto cambia a (k · σ)

MEDIDAS DE POSICIÒN

a) Cuantiles: Un cuantil es un valor bajo el cual se encuentra un cierto


porcentaje de los datos, cuando estos se ordenan de menor a mayor.
Existen los percentiles, deciles, quintiles y cuartiles, y se pueden calcular
solo en variables estadísticas cuantitativas.
En los percentiles el total de datos se divide en 100 partes iguales, cada una
de las cuales corresponde al 1% de la muestra, es decir, el percentil M es el valor
bajo el cual se encuentra el M% de los datos. Por ejemplo, el percentil 65
corresponde al valor bajo el cual se encuentra el 65% de los datos.

En los deciles, el total de datos se divide en 10 partes iguales, cada una de las
cuales corresponde al 10% de la muestra, es decir, el decil M es el valor bajo el
cual se encuentra el 10 x M% de los datos. Por ejemplo, el decil 3 corresponde al
valor bajo el cual se encuentra el 30% de los datos.

En los quintiles, el total de los datos se dividen en 5 partes iguales, cada una de
las cuales corresponde al 20% de la muestra, es decir, el quintil M es el valor bajo
el cual se encuentra el 20 x M% de los datos. Por ejemplo, el quintil cuatro
corresponde al valor bajo el cual se encuentra el 80% de los datos.

En los cuartiles, el total de los datos se divide en 4 partes iguales, cada una de
las cuales corresponde al 25% de la muestra, es decir, el cuartil M es el valor bajo
el cual se encuentra el 25 x M% de los datos. Por ejemplo, el cuartil 3 corresponde
al valor bajo el cual se encuentra el 75% de los datos.

MEDIDAS DE POSICIÓN EN TABLAS Y GRÁFICOS

La forma más práctica de obtener los cuantiles es utilizar la tabla de distribución


de frecuencias y encontrar el valor que le corresponde a la menor frecuencia
porcentual acumulada que iguala o sobrepasa el porcentaje buscado. Por ejemplo,
en la tabla adjunta:

Edad (años) Frecuencia Frecuencia Frecuencia


porcentual porcentual
acumulada
14 4 16% 16%
15 7 28% 44%
16 6 24% 68%
17 8 32% 100%
Total

El percentil 73 corresponde al valor bajo el cual se encuentra el 73% de los datos,


y la menor frecuencia porcentual acumulada que iguala o sobrepasa dicho
porcentaje es 100%. Luego, el percentil 73 es 17 años.

El quintil 2 corresponde al valor bajo el cual se encuentra el 40% de los datos, y la


menor frecuencia porcentual acumulada que iguala o sobrepasa dicho porcentaje
es 44%. Luego, el quintil 2 es 15 años.
En caso de datos agrupados, solo se puede determinar el intervalo en el que se
encuentra un determinado cuantil. Por ejemplo, en la tabla adjunta:

Puntajes Frecuencia Frecuencia Frecuencia


porcentual porcentual
acumulada
1 20 14 17,5% 17,5%
21 40 28 35% 52,5%
41 60 16 20% 72,5%
61 80 12 15% 87,5%
81 100 10 12,5% 100%
Total

El decil 7 corresponde al valor bajo el cual se encuentra el 70% de los datos, y la


menor frecuencia porcentual acumulada que iguala o sobrepasa dicho porcentaje
es 72,5%. Luego, el decil 7 se encuentra en el intervalo 41 60 .

El cuartil 3 corresponde al valor bajo el cual se encuentra el 75% de los datos, y la


menor frecuencia porcentual acumulada que iguala o sobrepasa dicho porcentaje
es 87,5%. Luego, el cuartil 3 se encuentra en el intervalo 61 80

Sin embargo, la fórmula que permite determinar el percentil Pk es:

 k 
n  Fa 
Pk  a  b  a    100  ; en donde:
 f 
 
 

n : cantidad total de datos.

a,b : intervalo que tiene una frecuencia acumulada F de, al menos, n


k
datos.
100

Fa: Frecuencia acumulada anterior a la frecuencia acumulada del intervalo a, b .

f : frecuencia absoluta del intervalo a, b .


Ejercicio:

Se encuestó a un grupo de personas y se les preguntó por el monto de su


cuenta del agua correspondiente al mes anterior. Los datos obtenidos se
registraron en la siguiente tabla:

Monto cuenta f F
5.000  10.000 15
10.000  15.000 23
15.000  20.000 32
20.000  25.000 30
Total

- Completa la tabla con la Frecuencia Acumulada (F)


- ¿A cuántas personas se encuestó?
- ¿En qué intervalo se encuentra el valor que representa hasta el 75% del
total de los datos?
- Determina en qué intervalo se encuentra el quinil 2
- Dónde se encuentra el cuartil 3?
- Determina el conjunto de datos que corresponden al cuarto decil.
- ¿Cuál es el tercer cuartil?
- ¿Qué valores constituyen el segundo quintil?

75 75
n  75%  n    
100 100

Conceptos u observaciones:

Los cuartiles (Qk, con k = 1, 2, 3), quintiles (quintilk, con k = 1, 2, 3, 4),


deciles (Dk, con k = 1, 2, 3, …..,9) y percentiles (Pk, con k = 1, 2, 3, 4, ……,99)
son números que dividen un conjunto de datos en partes iguales. De esta manera,
los cuartiles dividen al conjunto en cuatro 4partes iguales, los quintiles lo dividen
en 5 partes iguales, los deciles lo dividen en 10 partes iguales y los percentiles lo
dividen en 100 partes iguales.

También podría gustarte