Organización y Presentación de Datos

También podría gustarte

Está en la página 1de 84

ORGANIZACIÓN Y PRESENTACIÓN

DE DATOS
90
80
70
60
50
40
30
20
10
0
1er trim. 2do trim. 3er trim. 4to trim.

Lic. Justa Caridad Huaroto Sumari


ESTRUCTURA

 Organización y presentación de datos.


 Tablas de frecuencia para variable
categórica.
 Tablas de frecuencia para variable
numérica.
 Representación gráfica.
Organización de datos

 Una vez obtenidos los datos, como producto


de la aplicación de un instrumento de
medición, se realiza la crítica, se hace la
codificación y se almacenan en una matriz
de datos.
 Para explotar la base de datos y reportar los
resultados del estudio, se requiere organizar
los datos usando las técnicas estadísticas.
PRESENTACION DE DATOS
.

Los datos ya organizados se presentan


mediante:
 tablas de frecuencias y
 representaciones gráficas
Las dos representaciones exponen,
ordenadamente, la información recogida de
una población o de una muestra.
TABLAS DE FRECUENCIA:

Las tablas de frecuencia son el resumen del


comportamiento de una sola variable.
TABLAS DE CONTINGENCIA:

Las tablas de contingencia o tablas


estadísticas muestran la relación entre dos
o más variables.
GRÁFICOS:

Generalmente, los gráficos se utilizan como


complemento, para ilustrar mediante figuras
el comportamiento de las variables y
además facilitan la comprensión de los
fenómenos estudiados
Presentación de datos en tablas
de frecuencias

Dependiendo del tipo de variable y de la


naturaleza de los datos, se harán diferentes
presentaciones.
Básicamente, interesa organizar los datos y
presentarlos adecuadamente, de manera
que facilite su interpretación.
En algunos casos se considera que se ha
recopilado un conjunto de n datos de la
muestra y en otros, que se cuenta con N
datos de la población.
Partes de una tabla estadística

• Número de tabla
• Título
• Encabezamiento
• Talón o columna matriz.
• Cuerpo
• Notas explicativas.
Estas mismas partes son válidas para un
cuadro estadístico o un gráfico.
Gráficos estadísticos

La característica principal de un buen


gráfico es que debe ser explicativo por sí
mismo, facilitando la interpretación de los
datos.
El principio de construcción de los gráficos
son las coordenadas rectangulares.
Partes principales de un grafico

• Número de gráfico
• Título
• Escalas
• Leyenda
• Notas explicativas
Tablas de frecuencia

Frecuencia:
Es el número de veces que se repite un
mismo dato al medir una variable.
Tablas de frecuencia

Con los datos ya organizados en una base


de datos, construimos las tablas de
frecuencia, una para cada variable.
Tablas de frecuencia

Si la variable es categórica:
Los datos se organizan de acuerdo a las
diferentes categorías de la variable.

Si la variable es numérica:
Los datos se agrupan en clases.
 Como producto de la observación, conteo o
medición de la variable en cada unidad
estadística, se obtiene un conjunto de
respuestas o datos.
CASO 1. Tablas de frecuencias para
variables categóricas

Si la variable es categórica, a cada una de


las respuestas o datos diferentes se les
llama nivel, categoría o modalidad.
Una vez identificadas, se las dispone al lado
izquierdo de la tabla, en el talón, formando
la columna de categorías, y enseguida se
procede a hacer el conteo de datos que
caen en cada categoría.
El número de datos por categoría se conoce
como frecuencia absoluta simple y se
denota como fi.
Tabla de distribución de
frecuencias:

Frecuencia
Variable fi
categoría 1 f1
categoría 2 f2
. .
. .
. .
categoría k fk
Como puede verse, la tabla mostrada,
indica la distribución de un conjunto de
datos en categorías.
- A veces, va a ser preferible conocer la
proporción de datos por categoría.
Entonces, se deben usar las frecuencias
relativas, hi, las cuales se obtienen
dividiendo cada frecuencia absoluta entre
N (ó n).

fi
hi 
N
EJEMPLO 1
Se distribuyó un nuevo producto
alimenticio en una muestra de 50 amas de
casa para que lo degusten y
posteriormente se les pidió que lo
califiquen anónimamente, según los
siguientes niveles:
A: Excelente B: Muy Bueno C: Bueno
D: Regular E: Malo
Los datos obtenidos son:
B A C B B E B C A D
B B A C D E B A C B
B C B A D B A C B D
E B A B C B A B D C
B A B D E A C B A E
 Quién es la unidad de análisis?
 Qué se desea medir en cada unidad de
análisis (variable)?
 Tipo de variable?
 Enseguida, procedemos a presentar estos
datos en una tabla de frecuencias para
variable categórica.
Tabla 1
Distribución de frecuencias absolutas y relativas
de las calificaciones de un producto

Calificación fi hi
(%)
A 11 22
B 19 38
C 9 18
D 6 12
E 5 10
TOTAL n=50 100
 Las tablas de frecuencias son herramientas
de trabajo intermedio que se usan en el
proceso de análisis de los datos.
 Pero, para presentar la información se
debe convertir una tabla de frecuencias en
un cuadro estadístico, como el que se
muestra a continuación.
Cuadro Nº1
CALIFICACIONES DE UN NUEVO PRODUCTO
DADAS POR UN GRUPO DE AMAS DE CASA
Calificación Número de Porcen-
Amas de casa taje
EXCELENTE 11 22
MUY BUENO 19 38
BUENO 9 18
REGULAR 6 12
MALO 5 10
TOTAL 50 100

FUENTE: GERENCIA DE PERSONAL


EJEMPLO 2
Cuadro Nº 2: Estado civil de un grupo de 45
amas de casa.

Estado civil Conteo Porcentaje

Casada 26 58

Soltera 2 4

Conviviente 17 38

TOTAL 45 100
Representación gráfica
Las frecuencias que se indican en las
columnas de este tipo de tablas pueden
representarse mediante:
barras rectangulares (figura 1) o
sectores circulares (figura 2).

Veamos estos dos tipos de gráficos con las


frecuencias del cuadro No. 2
Gráfico de Barras

Estado Civil

30
25
20
15
10
5
0
conv casada soltera
Gráfico Circular

Estado Civil casada


58%

conv
soltera
38%
4%
CASO 2. Tablas de frecuencias de
variables numéricas

En este caso, debemos distinguir dos


situaciones:

La primera, si entre los datos existen pocos


valores diferentes, se hace un listado de
esos valores y las clases serán
precisamente cada uno de esos valores
diferentes.
 La segunda, si los datos son numerosos
y existen muchos valores diferentes, las
clases serán intervalos de números reales.
Se acostumbra presentar a los datos de
variable discreta según la primera situación
y a los datos de variable continua según la
segunda situación.
Hay que precisar que estos tipos de
presentaciones no son exclusivas de dichos
tipos de variables estadísticas.
Tabla de distribución de frecuencias para
variable numérica discreta

X fi hi Fi Hi
x1 f1 h1 F1 H1
x2 f2 h2 F2 H2
. . . . .
. . . . .
. . . . .
xk fk hk Fk Hk
fi es la frecuencia absoluta.

Representa el número de veces que se repite


cada dato.

Se cumple: ∑ f i = N (ó n)
hi = fi / N conocida como la frecuencia
relativa.

Expresa la fracción de las veces que aparece el


dato i- ésimo.

Se cumple: ∑ h i = 1
 Fi = f1 + f2 + ... + fi,
es la frecuencia absoluta acumulada.

Acumula el número de veces que se presentan


los datos menores o iguales al i-ésimo dato.

Se cumple: F k = N (ó n)

.
Hi = h1 + h2 + ... + hi,
es la frecuencia relativa acumulada.

Acumula la fracción de las veces que se


presentan los datos menores o iguales al i-
ésimo dato.

Se cumple: H k = 1.00

.
EJEMPLO 3
Se aborda a un grupo de 50 familias y
se les pregunta acerca del número de
personas que laboran en cada familia.
Los resultados fueron los siguientes:
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
Podemos observar que la variable “Número
de personas que laboran en la familia”
toma valores comprendidos entre 1 y 4, por
lo que es necesario construir una tabla de
frecuencias en la que se resuman estos
datos, denotando a la variable como X, tal
como se muestra:
Tabla 2
Distribución de frecuencias del número de personas que
laboran, por familia.
X fi

1 16
2 20
3 9
4 5
Total 50
Esta tabla describe la manera como están
distribuidos los datos, permitiendo hacer
interpretaciones acerca del patrón de
comportamiento de los mismos y es un
punto de partida en la búsqueda de un
modelo teórico para analizar tal
distribución.
Considerando todas las frecuencias
tenemos:
Xi fi hi Fi Hi

1 16 0.32 16 0.32

2 20 0.40 36 0.72

3 9 0.18 45 0.90

4 5 0.10 50 1.00

Total 50 1.00
Ejemplo 4
Se tiene el registro del número de partos de 45 madres de familia,
del Hospital Almenara, en la 1ª semana de marzo 2017.

2 2 1 3 3
2 5 2 4 3
4 5 1 2 1
1 3 2 2 3
1 4 2 1 3
3 2 3 1 2
2 1 1 3 2
1 2 1 1 2
3 3 2 2 5
Tabla de Distribución de Frecuencias
Frecuencia Frecuencia
Absoluta Relativa
N° de N° de
partos madres
fi hi
1 12 0.27
2 16 0.35
3 11 0.24
4 3 0.07
5 3 0.07
Total 45 1
Gráfico de Varas o bastones
Número de Partos
40

30

20
%

10

1 2 3 4 5
No de partos
Tabla de frecuencias para variable
numérica continua:

Procedimiento:

1. Calcular el Rango de los datos, R.


R = dato mayor – dato menor
R = X(N) – X(1)
2. Escoger el número de intervalos, k.
5 ≤ k ≤ 15
El valor de k se puede elegir por
conveniencia o tomando en cuenta
los siguientes criterios:

k N
k  1 3.32 * log N
Donde N es el tamaño de la población.
El segundo es llamado “Criterio de
Sturges”.
3. Hallar la amplitud, c, de cada
intervalo.

R
c
k
4. Se procede a construir los intervalos
semiabiertos, de amplitud constante.
El límite inferior del primer intervalo es el
dato mínimo.
Agregándole a este límite la amplitud se
tendrá el límite superior.
El segundo intervalo tiene como límite
inferior el límite superior del intervalo
anterior.
Agregándole a este límite la amplitud se
tiene el límite superior.
Y así sucesivamente se van generando los
intervalos de clase.
La construcción de intervalos de clase
semiabiertos, de amplitud constante, es
como sigue:
[Linf Lsup )
I1 [X(1) X(1) + c )
I2 [X(1) + c X(1) + 2c)
I3 [X(1) + 2c X(1) + 3c)
.
.
IK [X(1) + (k-1)c X(n) )
5. Se procede a hacer el conteo, ubicando
cada dato en el intervalo correspondiente y
se completa el cuadro agregando
columnas, como en el caso anterior,
considerando todas las frecuencias
definidas anteriormente.
EJEMPLO 5

A un grupo de 30 alumnos de la EPG se les


pregunta cuál es la cantidad de dinero que
portan en ese momento. Se obtienen los
siguientes datos:
450 1500 1200
80 1315 675
1595 250 985
5 2680 560
375 3000 175
125 200 785
1152 2205 100
25 425 600
2300 300 185
180 605 1100
 El Rango está dado por:
R = 3000 - 5 = 2995
 Aplicando Sturges tenemos:
k = 1 + 3.32 * log 30 = 5.9
k=5ó6
Por comodidad escogeremos 5.
 La amplitud de cada intervalo será:
c = 2995 / 5 = 599
La tabla resultante es:

Intervalos fi hi Fi Hi
5 - 604 16 0.5333 16 0.5333
604 - 1203 7 0.2333 23 0.7666
1203 - 1802 3 0.1000 26 0.8666
1802 - 2401 2 0.0667 28 0.9333
2401 - 3000 2 0.0667 30 1.0000
Total 30 1.0000
EJEMPLO 6

Con la finalidad de determinar el número


de horas diarias que las amas de casa se
dedican a ver televisión, se llevó a cabo
una encuesta, obteniéndose los siguientes
resultados, expresados en horas:
4,4 5,2 4,5 4,6 4,1 4,3 4,3 4,8 5,0 4,4

4,7 2,8 3,6 3,8 4,9 5,4 4,5 4,7 3,1 4,2

3,9 5,7 5,3 4,5 4,7 3,3 3,7 4,3 4,9 5,0

4,5 4,7 3,4 4,3 3,9 5,6 5,3 4,8 4,0 3,5

4,2 4,3 5,0 6,3 4,6 4,2 3,6 6,0 3,8 4,0
N = 50

Rango: R = 6,3 – 2,8 = 3,5

Por Sturges: k = 1 + 3,32 * log 50 = 6,64


k=7

Amplitud de cada intervalo:

c = 3,5 / 7 = 0,5
Tabla Nº 4: Distribución de frecuencias
del tiempo dedicado a ver T.V.

Horas X’i fi hi% Fi Hi%


2,8 – 3,3 3,05 2 4 2 4
3,3 – 3,8 3,55 6 12 8 16
3,8 – 4,3 4,05 10 20 18 36
4,3 – 4,8 4,55 17 34 35 70
4,8 – 5,3 5,05 8 16 43 86
5,3 – 5,8 5,55 5 10 48 96
5,8 – 6,3 6,05 2 4 50 100
Total -- 50 100 -- --
En la segunda columna de la tabla se
tiene la “marca de clase”, X’i.
La marca de clase es el punto medio del
intervalo. Se calcula sumando los límites
del intervalo indicado y dividiendo esta
suma por 2.
La marca de clase representa a todos
los valores que caen dentro de un
intervalo.
También se puede observar que las
frecuencias relativas aparecen en
porcentajes. A veces, es conveniente
expresarlas así, pues facilitan las
interpretaciones y permiten hacer
comparaciones.
EJEMPLO 7
Se registró el peso de 45 recién nacidos en el Hospital San
Bartolomé en enero del 2017. Los datos son los siguientes:

2.62 2.94 3.10 3.30 3.62


2.65 2.95 3.10 3.30 3.62
2.75 2.97 3.10 3.40 3.80
2.80 3.00 3.14 3.40 3.85
2.80 3.00 3.18 3.50 3.90
2.86 3.00 3.18 3.50 4.00
2.90 3.00 3.20 3.56 4.04
2.90 3.05 3.30 3.60 4.35
2.90 3.08 3.30 3.60 4.65
Pasos para la construcción de la tabla:
1. Cálculo de la amplitud o rango ( R )
R = Xmax - Xmin
R = 4.65 – 2.62 = 2.03
2. Determinar el número de intervalos de clase ( k )
Utilizando la regla de Sturges:
k = 1 + 3.3 log N (donde N es el número de observaciones)
k = 1 + 3.3 log 45 = 6.4556 (6 ó 7 intervalos)
Por redondeo simple, al entero más cercano, k = 6
3. Determinar la amplitud, c, de los intervalos de clase:
R 2.03
C   0.33833
k 6

Redondeando por exceso, según la cantidad de decimales de


los datos, C = 0.34
Tabla de Distribución de Frecuencias
Marca Frec. Frec. Frec. Frec.
de
Abs. Rel. Abs. Rel.
clase
PESOS Acum. Acum.
[LI-LS> X i' fi hi Fi Hi
[2.62-2.96> 2.79 11 0.24 11 0.24
[2.96-3.30> 3.13 14 0.32 25 0.56
[3.30-3.64> 3.47 13 0.29 38 0.85
[3.64-3.98> 3.81 3 0.07 41 0.92
[3.98-4.32> 4.15 2 0.04 43 0.96
[4.32-4.66] 4.49 2 0.04 45 1
TOTAL 45 1
Histograma de Frecuencias
Es un gráfico de bandas rectangulares contiguas, sin espacio entre ellas.
Cada barra representa la frecuencia (absoluta o relativa) de un intervalo de
clase.

Peso de Bebés

30

20
Percent

10

2.45 2.79 3.13 3.47 3.81 4.15 4.49 4.83


Peso
Polígono de Frecuencias
Es el gráfico que resulta al trazar un polígono que pase por los puntos
(Xi, fi) o por los puntos (Xi, hi). Para construir este gráfico, se debe
considerar dos intervalos adicionales: uno anterior al primero y otro
posterior al último, cada uno de ellos con frecuencia cero.

Peso de Bebés

30

20
Percent

10

2.45 2.79 3.13 3.47 3.81 4.15 4.49 4.83


Peso
Ojiva de Frecuencias Absolutas
Es el gráfico que resulta al trazar un polígono que pase por los
puntos (LSi, Fi). En este gráfico se debe considerar adicionalmente
el punto (LI1, 0).

45
40
35
30
25
Fi

20
15
10
5
0
2,62 2,96 3,3 3,64 3,98 4,32 4,66
Peso de recien nacidos
Ojiva de Frecuencias Relativas
Es el gráfico que resulta al trazar un polígono que pase por los
puntos (LSi, Hi). En este gráfico se debe considerar adicionalmente
el punto (LI1, 0).

1.00

0.80

0.60
Hi

0.40

0.20

0.00
2.62 2.96 3.3 3.64 3.98 4.32 4.66
Peso de recien nacidos

También podría gustarte