Está en la página 1de 10

Unidad II

Recolección, organización y presentación de datos


estadísticos.

Desde un primer momento que nos planteamos un problema o situación objeto de


estudio, debemos valernos de los datos que nos suministraran la información estadística
necesaria para llegar a resultados reales del contexto.

En esta unidad estaremos tratando procesos inherentes al método estadístico, los


que corresponden a la organización y análisis de datos. Es importante resaltar que el
ordenamiento es de gran utilidad para abordar para abordar un conglomerado de datos
que dificulta los procesos de análisis e interpretación.

El PROCESO DE RECOLECCIÓN de datos estadísticos puede ser realizado a través de


fuentes primarias o secundarias. En las primeras, la persona o la institución ha
recolectado directamente los datos de la población. Mientras que en las segundas,
los datos son obtenidos de publicaciones y trabajos efectuados por otras personas o
entidades que han recolectado directamente la información.

Una vez recolectada la información de las diferente fuentes, se reúnen una gran
cantidad de datos, que a su vez requieren una organización a través de las clases o
categorías que determinan de manera más resumida y organizada la frecuencia y otros
datos que permitirá llega a interpretaciones posteriores. El ordenamiento se concreta por
medio de la tabla de distribución de frecuencias en clases.
Ascendente:
Para realizar del PROCESO DE ORDENAMIENTO hay que seguir los siguientes de menor a
pasos: mayor.
a. Ordenamiento: consiste en ordenar de manera ascendente o descendente Descendente:
de mayor a
los datos numéricos recolectados de las unidades estadísticas. menor.
b. Rol de frecuencia: una vez ordenados los datos se determina cuantas veces
se repiten los datos
c. Tabla de frecuencia: en este último paso, se realiza la tabla de
discriminando las clases, la frecuencia, las proporciones y los porcentajes
de la información y a partir de ellos se establecen las conclusiones del
estudio.

Una vez concluidos los procedimientos de ordenamiento y el rol de frecuencia se


procede a la elaboración de la tabla de frecuencia y para ello necesitamos saber:
CLASE
Es cada uno de los grupos en que se dividen los datos. Es Fórmula de Stugart:
importante mencionar que el número de clases ( ) puede ser
establecido de dos formas: la primera es tomar de manera
arbitraria el número de clases (no recomendable) y la
segunda utilizando la fórmula de Stugart. Donde es el número
total de datos.
Ancho de
Es el espacio que hay entre el límite superior y el límite inferior de la clase.
la clase
Paso 1: Determinar el tamaño del Paso 2: calcular el tamaño de la clase
intervalo total

Se calcula
siguiendo
 : Ancho del intervalo de clase.
Donde
 : Ancho del intervalo total
Donde
estos
 : valor máximo de la serie de  : Ancho del intervalo total.
pasos
 : Numero de clases.

datos.
: valor mínimo de la serie de
datos.

Columnas de la tabla de frecuencia


Frecuencia Absoluta o
Cantidades

Es el número de veces que se repite un valor


simple ( )
Es la sumatoria de las frecuencias absolutas
Frecuencia absoluta
de todos los valores inferiores o iguales al
acumulada ( )
valor considerado
Se obtienen dividiendo la frecuencia
Proporciones

Frecuencia relativa ( ) absoluta de cada valor entre el número total


de datos.
Se obtiene al dividir cada frecuencia
Frecuencia relativa
absoluta acumulada entre el número total
acumulada ( )
de datos
Frecuencia relativa Este resulta de multiplicar la frecuencia
Porcentajes

porcentual ( ) relativa simple por 100%


Frecuencia relativa
Este resulta de multiplicar la frecuencia
acumulada porcentual
relativa acumulada por 100%
( )
Marca de la Se obtiene dividiendo entre dos la suma de los valores
clase extremos de cada clase ( : límite inferior) ( : límite
superior
Ejemplos:

1. Suponga que un investigador desea determinar como varia el peso de un grupo de


estudiantes de primer semestre de una universidad. Selecciona una muestra de 50
estudiantes y registra su peso en kilogramos, los datos obtenidos fueron los
siguientes: 65, 63, 65, 63, 69, 67, 53, 58, 60, 61, 64, 70, 68, 66, 55, 57, 60, 62, 64, 65,
64, 68, 70, 66, 56, 59, 61, 62, 63, 65, 65, 70, 67, 66, 57, 59, 61, 62, 64, 64, 63, 69, 67,
66, 58, 60, 61, 62.

Solución:
Siguiendo el proceso de ordenamiento se tiene:
a. Ordenamiento ascendente: 53, 55, 56, 57, 57, 58, 58, 59, 59, 60, 60, 60, 61, 61, 61,
61, 62, 62, 62, 62, 63, 63, 63, 63, 63, 64, 64 64, 64, 64, 64, 65, 65, 65, 65, 65, 66, 66,
66, 66, 67, 67, 67, 68, 68, 69, 69, 70, 70, 70.

b. Rol de frecuencia y tabla de frecuencia:

Valores Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


absoluta absoluta relativa relativa relativa relativa
acumulada acumulada porcentual acumulada
porcentual
Peso (Kg)
53 1 1 0,02 0,02 2% 2%
55 1 2 0,02 0,04 2% 4%
56 1 3 0,02 0,06 2% 6%
57 2 5 0,04 0,1 4% 10%
58 2 7 0,04 0,14 4% 14%
59 2 9 0,04 0,18 4% 18%
60 3 12 0,06 0,24 6% 24%
61 4 16 0,08 0,32 8% 32%
62 4 20 0,08 0,4 8% 4%
63 5 25 0,1 0,5 10% 5%
64 6 31 0,12 0,62 12% 62%
65 5 36 0,1 0,72 10% 72%
66 4 40 0,08 0,8 8% 8%
67 3 43 0,06 0,86 6% 86%
68 2 45 0,04 0,9 4% 9%
69 2 47 0,04 0.94 4% 94%
70 3 50 0,06 1 6% 100%
N=50 1 100%
Para construir una tabla de datos no agrupados se debe calcular lo siguiente:
1) Número de clases: Aplicando la fórmula de Stugart

Cuando N=50, se tiene:

2) Tamaño del Intervalo total: Considerando la siguiente fórmula:

Se tiene que;
3) Ancho de la clase: Según lo indicado en la teoría el ancho de la clase se obtiene a
través de la siguiente formula:

Tal que
Así la tabla con datos agrupados nos queda como sigue:

Clases Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Marca


absoluta absoluta relativa relativa relativa relativa de
acumulada acumulada porcentual acumulada clase
porcentual
Peso (Kg)
53- 55,42 2 2 0,04 0,04 4% 4% 54,21
55,42 -57,84 3 5 0,06 0,1 6% 10% 56,63
57,84- 60,26 7 12 0,14 0,24 14% 24% 59,05
60,26-62,28 8 20 0,16 0,4 16% 40% 61,47
62,28- 64,7 11 31 0,22 0,62 22% 62% 63,89
64,7-67,12 12 43 0,24 0,86 24% 86% 66,31
67,12- 70 7 50 0.14 1 14% 100% 68.56
N=50 1 100%

2. Calificaciones obtenidas en la primera evaluación de estadística aplicada ala


educación a los estudiantes de la sección 6E403 de la especialidad de Educación
Integral del lapso I-2012.

Nombre Calif. Nombre Calif. Nombre Calif. Nombre Calif.


Rosa 04 Laura 15 Enmanuel 04 Yudy 18
Yesenia 05 Mirian 18 Adriana 05 Miguel 19
Maria 18 Jose 07 Javier 05 Sofia 13
Reina 19 Daniel 06 Gragorio 14 Juan 15
Luis 12 Erica 07 Alfredo 12 David 18
Edgard 08 Luisa 18 Eduardo 14 Carlos 19
Oscar 14
Ordenando de manera ascendente se tiene que los datos quedan de la siguiente forma:

Nombre Calif. Nombre Calif. Nombre Calif. Nombre Calif.


Rosa 04 Erica 07 Eduardo 14 Yudy 18
Enmanuel 04 Edgard 08 Oscar 14 Mirian 18
Javier 05 Luis 12 Juan 15 David 18
Yesenia 05 Alfredo 12 Laura 15 Miguel 19
Adriana 05 Socia 13 Luisa 18 Carlos 19
Daniel 06 Gregorio 14 María 18 Reina 19
José 07

 La nota más baja es 4


Con solo el ordenamiento se pueden extraer conclusiones como:

 La calificación más alta es 19


 Existen más aprobados
 Hay solo 9 alumnos aplazados

.
Realizando el rol de frecuencia y la tabla de distribución de frecuencias pero para datos
agrupados se tiene:

Número de clases Tamaño de intervalo Tamaño de intervalo de


total clase

Como N=25, se tiene: Se tiene que; Tal que

Clase Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Marca


absoluta absoluta relativa relativa relativa relativa de
acumulada acumulada porcentual acumulada clase
porcentual
Calif.
04 – 6,5 6 6 0,24 0,24 24% 24% 5,25
6,5- 9 3 9 0,12 0,36 12% 36% 7,75
9 – 11,5 0 9 0 0,36 0% 36% 10,25
11,5 – 14 6 15 0,24 0,6 24% 60% 12,75
14 – 16,5 2 17 0,08 0,68 8% 68% 15,25
16,5 – 19 8 25 0.32 1 32% 100% 17,75
N=25 1 100%
3. Con el ejemplo siguiente se muestra la elaboración e interpretación de una distribución
de frecuencia de datos cualitativos. Cinco refrescos muy conocidos son Coca cola
clásica (Coke Classic), Coca cola de dieta (Diet Coke), Dr. Pepper, Pepsi y Sprite.
Suponga que los datos de la tabla siguiente muestran los refrescos que fueron
comprados en una muestra de 50 ventas de refresco.

Coke Classic Sprite Pepsi Pepsi Coke Classic


Diet Coke Coke Classic Coke Classic Coke Classic Coke Classic
Pepsi Diet Coke Coke Classic Dr. Pepper Pepsi
Diet Coke Coke Classic Coke Classic Sprite Coke Classic
Coke Classic Diet Coke Pepsi Coke Classic Sprite
Coke Classic Coke Classic Dr. Pepper Diet Coke Dr. Pepper
Dr. Pepper Sprite Coke Classic Coke Classic Pepsi
Diet Coke Pepsi Diet Coke Coke Classic Diet Coke
Pepsi Coke Classic Pepsi Pepsi Pepsi
Sprite Pepsi Pepsi Dr. Pepper Coke Classic

Solución:

En los casos anteriores los datos han sido ordenados y organizados por sus características
cuantitativas y atendiendo a la escala de medición utilizada, en caso de los datos
cualitativos utilizamos la escala de medición nominal, en este caso se pueden ordenar
según orden alfabético ascendente. En este caso, nuestra variable es refresco vendido,
por lo que los valores son los diferentes nombres de refrescos tal que la tabla de
frecuencia quedaría:

Valores Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


absoluta absoluta relativa relativa relativa relativa
acumulada acumulada porcentual acumulada
porcentual
Nombre
del
refresco
Coke 19 19 0,38 0,38 38% 38%
Cassic
Diet Coke 8 27 0,16 0,54 16% 54%
Dr Pepper 5 32 0.1 0,64 10% 64%
Pepsi 13 45 0,26 0,90 26% 90%
Sprite 5 50 0,1 1 10% 100%
N=50 1 100%
Elaboración de gráficos:

Una de las ventajas más importantes de la construcción de las tablas de frecuencia es


facilitar la elaboración de los gráficos, los cuales permiten una interpretación sencilla y
rápida de la información. Dependiendo del tipo de datos y su representación en tablas
agrupadas o no se tienen las siguientes representaciones graficas:

Diagrama de barras: Horizontal

Los diagramas de barras se utilizan para representar datos cualitativos Vertical


o cuantitativos no agrupados.

Se representan en el plano coordenado, colocando en el eje horizontal


(x) los diferentes valores de la variable y en el eje vertical (y) las frecuencias absolutas,
relativas o acumuladas.

Los datos se representan mediante barras disjuntas de una altura proporcional a la


frecuencia.

Ejemplo:

4. Haciendo referencia al ejemplo 1, y su tabla de frecuencias con datos no agrupados


podemos realizar los siguientes diagramas de barras:

60
frecuencia absoluta acumulada

7
frecuencia absoluta simple

6 50
5 40
4
3 30
2 20
1
0 10
53 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 0
peso(kg) 53 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70
peso (kg)

También es posible realizar un diagrama de barras de la frecuencia relativa pero se deja


como asignación para el estudiante.
Histograma de frecuencia:

Es una representación gráfica de una variable cuantitativa en forma de barras


consecutivas. Se utiliza para variables continuas o discretas que se han agrupado en
clases.

En el eje horizontal (x) se construyen uno rectángulos que tienen por base la amplitud del
intervalo y por altura la frecuencia de cada intervalo, la cual se representa en el eje
vertical (y)

Ejemplo:

5. Haciendo referencia a los datos agrupados reflejados en la tabla de frecuencia del


ejemplo 2, se puede elaborar el siguiente histograma.
9
8
Frecuencias absolutas

7
6
5
4
3
2
1
0

Calificaciones

Polígono de frecuencia

Son gráficos lineales que se utilizan en caso de variables cuantitativas, se construyen a


partir de la relación entre las marcas de clase (puntos medios) y las frecuencias de cada
clase cuando la variable es agrupada, uniendo los extremos con una línea continua.
Algunos estadísticos frecuentemente realizan este grafico sobre el mismo histograma de
frecuencia.

Ejemplo:

6. Con relación al histograma anterior se puede plantear el siguiente polígono de


frecuencia
9
8

Frecuencias absolutas
7
6
5
4
3
2
1
0

Calificaciones

Grafica circular

Este tipo de diagrama se puede utilizar para todo tipo de variables (cualitativas,
cuantitativas) pero se usa más frecuentemente para variables cualitativas.

Los datos se representan en un círculo de modo que el ángulo de cada sector es


proporcional la frecuencia que representa.

En el caso que el grafico circular se realice de forma manual debe efectuarse una serie de
conversiones previas para adecuar el valor en el sector del círculo. Para ello se utiliza la
siguiente formula:


Donde N es el número total de datos y la frecuencia absoluta del valor que se desea
representar.

Ejemplo:

7. Considerando los siguientes datos del ejemplo 3: Nombre


del
refresco
Coke 19
Classic
Diet Coke 8
Dr Pepper 5
Pepsi 13
Sprite 5
N=50
Calculemos el ángulo de los sectores circulares correspondientes,

Coke � 8 Sprite
Cassic 10%

Diet � 8
Coke Coke
Pepsi Classic
26%
Dr Pepper � 38%

Pepsi �
Dr. Pepper
10% Diet Coke
16%
Sprite �

Ojiva (grafica de frecuencias acumuladas)

Es un gráfico en forma de curva que representa el crecimiento acumulado en forma de


curva, resultando de la relación entre los extremos superiores de cada clase con las
frecuencias relativas porcentuales.

Ejemplo:

8. Con relación a los datos del ejemplo 2 se tiene la siguiente representación gráfica:

120%

100%

80%

60%

40%

20%

0%
4 6,5 9 11,5 14 16,5 19

También podría gustarte