Está en la página 1de 11

UTN Estadística y Costos Prof.

Aguilar Gisell

Formas de representar la información


La estadística descriptiva se divide en dos áreas. Estudiaremos primero la manera de
representar un conjunto de datos usando técnicas visuales para su análisis
(histograma diagramas circulares, tabla de frecuencias, etc.), luego desarrollaremos
algunas medidas numéricas de resumen para conjuntos de dato.

Resumen tabular: Tabla de frecuencias


Realizaremos una tabla en donde se indican distintas características de los
datos: la frecuencia, la frecuencia relativa y el porcentaje.

¿Cuánto da la suma
¿Qué es? ¿Cómo se calcula?
total?
Es el número de Solamente debemos Al sumar todos debe
La
veces que aparece contar la cantidad de dar por resultado el
frecuencia
en el conjunto de veces que está repetido tamaño de la muestra
absoluta
datos cada valor de cada valor en la muestra. (el total de datos)
(𝑓𝑎 )
la variable
La Es la proporción de Es la división entre la Al sumar todos debe
frecuencia la variable respecto frecuencia absoluta (𝑓𝑎 ) y dar por resultado 1
relativa a la muestra. el tamaño de la muestra o
(𝑓𝑟 ) de la población
La Representa cuan Se multiplica la frecuencia Al sumar todos debe
frecuencia frecuente es el dato relativa por 100 dar por resultado 100.
porcentual en la muestra
(𝑓𝑝 )

Un ejemplo:
Un determinado colegio secundario tiene 10 cursos. Se seleccionan, al azar, 5 alumnos
por curso y se anota la última calificación de matemática de cada uno, obteniéndose
en total las siguientes 50 calificaciones:

7, 2, 5, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 1, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6,
9, 6, 1, 4, 6, 3, 5, 5, 6, 7

Población: Todos los alumnos del secundario.

Muestra: 50 alumnos.

Variable: Ultima calificación de matemática obtenida (cuantitativa discreta)

Lo primero que nos conviene hacer siempre es ordenar los datos de menor a mayor,
teniendo cuidado de no olvidarnos ni escribir ninguno de más, una comprobación que
podemos hacer es contar los datos y que sean la misma cantidad que antes.

Los datos sin ordenar: 7, 2, 5, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 1, 8, 4, 8, 6, 6,


3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7

Los datos ordenados de menor a mayor: 1, 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5,


5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10

1
UTN Estadística y Costos Prof. Aguilar Gisell

Con estos datos ordenados podemos sacar fácilmente la frecuencia absoluta, la


frecuencia relativa y el porcentaje.

Por ejemplo, para la calificación 5(cinco) tenemos:


• Frecuencia absoluta = 11 (la cantidad de veces que aparece el 5 en la muestra)
• Frecuencia relativa = 11/50 = 0,22 (11 dividido 50, es decir, la frecuencia absoluta divido
la cantidad de datos, n, que en este ejemplo son 50)
• Frecuencia porcentual = 0,22 ∙ 100 = 22% (la frecuencia relativa multiplicada por 100)

Haciendo lo mismo para todas las posibles notas, del 1 al 10, construimos la siguiente
tabla de frecuencias:
𝑓𝑎
Dato Frec. absoluta (𝑓𝑎 ) Frec. relativa (𝑓𝑟 = ) Frec. porcentual (𝑓𝑝 = 𝑓𝑟 ∗ 100)
𝑛
2
1 2 =0,04 4%
50
2
2 2 =0,04 4%
50
3
3 3 =0,06 6%
50
5
4 5 =0,1 10%
50
11
5 11 =0,22 22%
50
12
6 12 =0,24 24%
50
8
7 8 =0,16 16%
50
4
8 4 =0,08 8%
50
2
9 2 =0,04 4%
50
1
10 1 =0,02 2%
50
SUMA: 50 1 100%

Para verificar esto, se suele calcular las Frecuencias absolutas acumuladas y


Frecuencias relativas acumuladas, es decir, la suma de las frecuencias absolutas y las
frecuencias relativas respectivamente.

2
UTN Estadística y Costos Prof. Aguilar Gisell

¿De qué nos sirve esta tabla?


Observando la tabla de frecuencia podemos sacar varias conclusiones, según lo que
queramos analizar, por ejemplo:

➢ La cantidad de alumnos aprobados (se aprueba con 7 o más): es la suma de las


frecuencias de los valores 7, 8, 9 y 10; es decir, 8+4+2+1=15. Aprobaron 15 de esos 50
alumnos.
➢ El porcentaje de alumnos aprobados: es la suma de los porcentajes de 7, 8, 9 y 10.
Es decir 16% + 8% + 4% + 2% = 30%. O sea que el 30% de los alumnos de la muestra
está aprobado.

➢ Por lo tanto, el 70% (100% - 30%) está desaprobado.


➢ El 24% obtuvo 6 y estuvo muy cerca de aprobar.
➢ Solo el 2% obtuvo la nota máxima 10.
➢ La nota que más se repite es el 6, seguido por el 5 y luego el 7.
➢ La nota que menos se repite es el 10, seguido por el 1 y el 2 (ambos con un 4% de
porcentaje).

Veamos otro ejemplo de un libro:

¿ Qué conclusiones podrías obtener?

3
UTN Estadística y Costos Prof. Aguilar Gisell

Resumen gráfico
Esta es una de las maneras más comunes de representación de datos, ya que lo
presentan de una manera visual. Por eso es la más usada en internet o televisión. Los
tipos de gráficos comúnmente utilizados para representar datos estadísticos son:

✓ Gráfico de columnas.

✓ Histograma.

✓ Gráfico de torta o circular.

✓ Polígono de frecuencias.

✓ Gráfico de caja (Boxplot).

• Gráfico de líneas.

• Gráficos de puntos.

• Gráfico de dispersión.

• Gráfico de burbujas.

Un ejemplo:
Un determinado colegio secundario tiene 10 cursos. Se seleccionan, al azar, 5 alumnos
por curso y se anota la última calificación de matemática de cada uno, obteniéndose
en total las siguientes 50 calificaciones:

7, 2, 5, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 1, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6,
9, 6, 1, 4, 6, 3, 5, 5, 6, 7

Para el gráfico de torta, es necesario que agreguemos a la tabla el ángulo, representa


el ángulo (en grados) del total de la circunferencia que le corresponde a cada variable.
Recordemos que una circunferencia tiene en total un ángulo de 360º por lo tanto la
suma de todos los ángulo debe dar siempre por resultado 360°.

Cada valor de la columna “ángulo” se obtiene multiplicando la frecuencia relativa por


360. Ángulo= Frec. relativa *360

Por ejemplo, para la calificación 5(cinco) tenemos:


• Frecuencia absoluta = 11 (la cantidad de veces que aparece el 5 en la muestra)
• Frecuencia relativa = 11/50 = 0,22 (11 dividido 50, es decir, la frecuencia absoluta divido
la cantidad de datos, n, que en este ejemplo son 50)
• Frecuencia porcentual = 0,22 ∙ 100 = 22% (la frecuencia relativa multiplicada por 100)
• Ángulo= 0,22*360 (la frecuencia relativa multiplicada por 360)

Haciendo lo mismo para todas las posibles notas, del 1 al 10, construimos la siguiente
tabla de frecuencias:

4
UTN Estadística y Costos Prof. Aguilar Gisell

Frec. absoluta Frec. relativa Frec. porcentual Ángulo


Dato 𝑓 (𝑓𝑟 *360)
(𝑓𝑎 ) (𝑓𝑟 = 𝑎 ) (𝑓𝑝 = 𝑓𝑟 ∗ 100)
𝑛
2
1 2 =0,04 4% 0,04*360=14,4°
50
2
2 2 =0,04 4% 0,04*360=14,4°
50
3
3 3 =0,06 6% 0,06*360=21,6°
50
5
4 5 =0,1 10% 0,1*360=36°
50
11
5 11 =0,22 22% 0,22*360=79,2°
50
12
6 12 =0,24 24% 0,24*360=86,4°
50
8
7 8 =0,16 16% 0,16*360=57,6°
50
4
8 4 =0,08 8% 0,08*360=28,8°
50
2
9 2 =0,04 4% 0,04*360=14,4°
50
1
10 1 =0,02 2% 0,02*360=7,2°
50
SUMA: 50 1 100% 360°

• Gráfico de columnas
Para realizar el gráfico de columnas trabajaremos con estos datos, extraídos de la
tabla:
Dato Frec. absoluta (𝑓𝑎 )
1 2
2 2
3 3
4 5
5 11
6 12
7 8
8 4
9 2
10 1
SUMA: 50

Se puede realizar manualmente en hoja cuadriculada, con regla, o con el programa


Excel.

En el eje horizontal se representan las variables y en el eje vertical se representan las


frecuencias. Cada variable se representa mediante una columna cuya altura es igual a
la frecuencia de dicha variable en la muestra.

5
UTN Estadística y Costos Prof. Aguilar Gisell

• Histograma
Un histograma es una representación gráfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados.

En el caso de variables discretas como el que vimos, el histograma coincide con el


gráfico de columnas.

• Gráfico de torta o circular


Para el gráfico de torta nos basamos en los siguientes valores obtenidos de la tabla de
frecuencias:
Ángulo
Dato
(𝑓𝑟 *360)
1 14,4°
2 14,4°
3 21,6°
4 36°
5 79,2°
6 86,4°
7 57,6°
8 28,8°
9 14,4°
10 7,2°
SUMA: 360°
6
UTN Estadística y Costos Prof. Aguilar Gisell

En el gráfico de torta los datos se representan


mediante una circunferencia. La circunferencia
tiene en total un ángulo de 360º (es decir, una
vuelta completa), por lo tanto los valores de los
grados de cada variable representa el ángulo
que se le asignará en la circunferencia.

Se puede hacer manualmente, en hoja


cuadriculada con compás y transportador, o
en el programa Excel. El gráfico de torta nos
queda de la siguiente manera:

Resumen analítico
Hasta el momento hemos visto dos maneras de organizar los datos estadísticos, para
luego poder analizarlos y sacar conclusiones: las tablas de frecuencia y los gráficos.
Hay otra serie de valores que nos brindan información importante sobre los datos y se
llaman los resúmenes numéricos.

Los resúmenes numéricos más utilizados son las medidas de tendencia central, las
medidas de posición y las medidas de dispersión. En esta ocasión vamos a ver las
medidas de tendencia central

Las medidas de tendencia central


Las medidas de tendencia central indican valores con respecto a los cuales los datos
parecen agruparse, o al menos eso pasa en la mayoría de los casos. Las medidas de
tendencia central que trabajaremos nosotros son las principales, es decir: la media, la
moda y la mediana.
• La media: es el promedio entre todos los valores de la muestra. Se obtiene al
sumar todos los datos, tantas veces como aparecen, y dividir esa suma por la
cantidad total de datos de la muestra. La media puede dar un valor que no
pertenezca a la muestra. Este parámetro presenta algunas Ventajas e inconvenientes:
- La media aritmética viene expresada en las mismas unidades que la variable.
- En su cálculo intervienen todos los valores de la distribución.
- Es el centro de gravedad de toda la distribución, representando a todos los valores
observados.
- Es única.
- Su principal inconveniente es que se ve afectada por los valores extremadamente
grandes o pequeños de la distribución.

7
UTN Estadística y Costos Prof. Aguilar Gisell

• La moda: es el valor que aparece con mayor frecuencia en la muestra, es decir, el


valor que más se repite. La moda es un valor que pertenece a la muestra. Este
parámetro presenta algunas Ventajas e inconvenientes :
- Su cálculo es sencillo.
- Es de fácil interpretación.
- Es la única medida de posición central que puede obtenerse en las variables de tipo
cualitativo.
- En su determinación no intervienen todos lo valores de la distribución.

• La mediana: es un valor que, al ordenar los datos de menor a mayor, divide al


conjunto de datos en dos grupos con igual cantidad de elementos. Es decir, el valor
que está en el medio de los datos. La mediana puede dar un valor que no pertenezca
a la muestra. Este parámetro presenta algunas Ventajas e inconvenientes :
- Es la medida más representativa en el caso de variables que solo admitan la escala
ordinal.
- Es fácil de calcular.
- En la mediana solo influyen los valores centrales y es insensible a los valores
extremos u “outliers ”.
- En su determinación no intervienen todos los valores de la variable. (esta sería una
desventaja)

Trabajando con el mismo ejemplo:


Un determinado colegio secundario tiene 10 cursos. Se seleccionan, al azar, 5 alumnos
por curso y se anota la última calificación de matemática de cada uno, obteniéndose
en total las siguientes 50 calificaciones:

7, 2, 5, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 1, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6,
9, 6, 1, 4, 6, 3, 5, 5, 6, 7

Los datos ordenados de menor a mayor: 1, 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5,


5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10

• La media: Debemos sumar todos los datos y dividir por la suma total

1+1+2+2+3+3+3+4+4+4+4+4+5+5+5+5+5+5+5+5+5+5+5+6+6+6+6+6+6+6+6+6+6+6+6+7+7+7+7+7+7+7+7+8+8+8+8+9+9+10

Una forma más sencilla de hacer esta suma es fijarse cuantas veces se repiten los
datos y utilizar multiplicaciones (Dato*frecuencia absoluta)

1*2+2*2+3*3+4*5+5*11+6*12+7*8+8*4+9*2+10*1=278

278
Dividiendo por la cantidad de datos: = 5,56
50

• La moda: es el valor que más se repite. En este caso es el 6.

8
UTN Estadística y Costos Prof. Aguilar Gisell

• La mediana: es el valor que está en el medio de los datos.

1+1+2+2+3+3+3+4+4+4+4+4+5+5+5+5+5+5+5+5+5+5+5+6+6+6+6+6+6+6+6+6+6+6+6+7+7+7+7+7+7+7+7+8+8+8+8+9+9+10

25 datos 25 datos

En este caso, como los datos son una cantidad par, no hay un valor que se encuentre
justo en el medio. En este caso lo que hay que hacer es obtener el promedio de los dos
datos que se encuentran en el medio, en este caso 6 y 6 (sumar y dividir por 2).

6 + 6 12
= =6
2 2

Por lo tanto el resumen es:

Media: 5,56

Moda: 6

Mediana: 6

Veamos otro ejemplo:


El equipo de fútbol del club deportivo “El Cóndor” hace una estadística de los goles
marcados en los últimos 30 partidos. Los datos de dicha cantidad de goles son los
siguientes:

Es decir, en el primer partido metió 1


gol, en el segundo 2, en el tercero
ninguno, y así sucesivamente.

Primero nos conviene ordenar los datos de menor a mayor, así:

000000011111111111222222333445

Vamos a calcular ahora la media, la moda y la mediana.

• Media o promedio:
0 ∗ 7 + 1 ∗ 11 + 2 ∗ 6 + 3 ∗ 3 + 4 ∗ 2 + 5 ∗ 1 45
= = 1,5
30 30

• Moda: 1 (el dato que más se repite)

9
UTN Estadística y Costos Prof. Aguilar Gisell
1+1 2
• Mediana: = =1
2 2

Para este ejemplo también vamos a hacer la tabla de frecuencia y el gráfico de barras.

Gráfico de columnas Gráfico de torta o circular

La media nos está informando que el promedio de goles es 1,5 por partido, es decir un
gol y medio por partido, pero… ¿Cómo es posible que un equipo haga un gol y medio
por partido? Es simple, no es posible, pero la media nos dice que el equipo suele hacer
frecuentemente 1 gol por partido, con tendencia a realizar más goles, esto se observa
claramente en el gráfico de columnas.

La moda es el valor que más se repite y se observa claramente que es 1, porque es la


columna más alta (recordemos que la altura es la frecuencia). La media es 1,5, quiere
decir que frecuentemente hará 1 gol, pero tendiendo a hacer más, dado que la
cantidad de veces que hace 2, 3, 4 y 5 goles, sumadas, superan a la cantidad de veces
que hizo 0 goles.

¿Y la mediana? Bueno, la mediana muchas veces no se observa en el gráfico, y es por


eso que fue necesario ordenar los valores de menor a mayor para obtenerla. Es el
valor para el cual quedan a la izquierda y a la derecha la misma cantidad de datos,
también nos ayuda a reconocer hacia donde tienden la mayoría de datos.
10
UTN Estadística y Costos Prof. Aguilar Gisell

Actividades optativas:
1) Indica que variables son cualitativas y cuales cuantitativas:
A) Comida Favorita de los integrantes de tu familia.
B) Profesión del personal de la UTN
C) Número de goles marcados por un equipo de futbol en la última temporada.
D) Número de alumnos de la Universidad Tecnológica Nacional, FRSC.
E) El color de los ojos de los alumnos de Estadística de la Tecnicatura Superior
en Seguridad e Higiene de la UTN.
F) Coeficiente intelectual de tus compañeros de clase.

2) De las siguientes variables indica cuáles son discretas y cuales continuas.


A) Número de acciones vendidas cada día en la Bolsa.
B) Temperaturas registradas cada hora en un observatorio.
C) El diámetro de las ruedas de varios autos.
D) Número de hijos de 50 familias.

3) El siguiente cuadro corresponde a la cantidad de accidentes laborales


declarados por el empleador, según el rubro de trabajo:

Realiza un cuadro de frecuencias y luego extrae una conclusión de los datos obtenidos

4) La siguiente tabla relaciona las ausencias al trabajo de 50 obreras durante el


mes de julio, en una fábrica de confección de telas.

a) Construir la tabla de distribución de frecuencias y un histograma. Extraer


conclusiones
b) Calcular las medidas de tendencia central.

11

También podría gustarte