Está en la página 1de 7

TEMA Nº4

ORGANIZACIÓN DE DATOS

1. REVISIÓN Y CORRECCIÓN DE DATOS

También denominada depuración de la información, constituye un control de la calidad de la


información.

Es de especial importancia para el investigador la recolección de datos en forma vigilada y


ordenada, en esta etapa que se obtiene gran cantidad de información o datos, los mismos
que pueden encontrarse en cuestionarios, grabaciones, fichas y videos , etc. Esta información
recopilada podría presentar algunos desaciertos. Por tanto se hace necesario revisar cada
uno de los formularios obtenidos con el fin de ver si los datos han sido registrados de manera
completa y fidedigna, para lo cual debemos responder las siguientes preguntas:

¿Están todos los cuestionarios?


¿Están todas las respuestas requeridas?
¿Existe incongruencia en la información?

2. DISTRIBUCIÓN DE FRECUENCIAS

Se llama distribución de frecuencias de una variable cualquiera, a la agrupación de datos en clases,


intervalos o categorías mutuamente excluyentes que indican el número de observaciones en cada
categoría o clase, facilitando de esta manera la representación ordenada de un conjunto numeroso
de datos.

Para realizar la agrupación o clasificación de los datos se debe utilizar una tabla denominada tabla de
distribución de frecuencias o simplemente tabla de frecuencias.

2.1 Tabla de distribución de frecuencias


FRECUENCIA FRECUENCIA
ABSOLUTA RELATIVA
FRECUENCIA FRECUENCIA ACUMULADA ACUMULADA
ABSOLUTA PORCENTUAL MAYOR QUE MAYOR QUE

Xi fi hi hi % Fi Fi Hi Hi
X1 f1 h1 h1% F1 H1
VALORES X2 f2 h2 h2% F2 H2
DIFERENTES
OBSERVADO …… ….. ….. ….. ……. …….

S
xn fi hn hn% Fn Hn

=n =1 100%

FRECUENCIA FRECUENCIA
FRECUENCIA
ABSOLUTA RELATIVA
RELATIVA
ACUMULADA ACUMULADA
MENOR QUE MENOR QUE
A continuación detallamos cada una de las frecuencias:

Frecuencia Absoluta fi

Es la cantidad de veces que se repite un determinado valor de la variable en estudio y tiene las siguientes
propiedades:

∑𝑘𝑖=1 𝑓𝑖 = n 0≤ fi ≤n

Frecuencia Relativa hi

Es el valor que resulta al dividir cada una de las frecuencias absolutas entre el número total de datos o
tamaño de muestra. Las frecuencias relativas se calculan mediante la siguiente relación:

𝑓𝑖 Propiedad:
ℎ𝑖 =
𝑛 𝑘 f1 + f2 + f 3 + . . . + fk = 1
∑ ℎ𝑖 = 1
𝑖=1

Frecuencia absoluta acumulada menor que Fi

Es la suma sucesiva de las frecuencias absolutas, donde la primera frecuencia absoluta acumulada, es
igual a la primera frecuencia absoluta y los demás se obtienen sumando y acumulando las frecuencias
absolutas en forma ascendente. Es decir:

F1 = f 1
F2 = f 1 + f 2
F3 = f1 + f2 + f3
. . . . . . . . . . . . . . .

Frecuencia absoluta acumulada mayor que Fi


Es la suma sucesiva de las frecuencias absolutas de abajo hacia arriba en forma descendente, donde la
primera frecuencia absoluta acumulada es igual al valor de “n” o tamaño de muestra.

Frecuencia relativa acumulada menor que Hi


Es la suma sucesiva de las frecuencias relativas, donde la primera frecuencia relativa acumulada siempre
es igual a la primera frecuencia relativa y las siguientes se obtienen sumando sucesivamente las
frecuencias relativas en forma ascendente.

H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3
. . . . . . . . . . . . . . .

Frecuencia relativa acumulada mayor que Hi


Es la suma sucesiva de las frecuencias relativas de abajo hacia arriba en forma descendente, donde la
primera frecuencia relativa acumulada es 1.
2.2. Procedimiento e interpretaciones de las frecuencias

El procedimiento para realizar la tabla de distribución de frecuencias, es el siguiente:

Ejemplo:

La información recopilada en una encuesta efectuada a 14 estudiantes sobre el número de libros


consultados para rendir el examen de estadística, es la siguiente:

2 1 1 2 1 3 2
3 1 4 1 2 0 1
Paso 1:
Para construir la tabla, se debe identificar el número de datos diferentes y se les ordena en forma
ascendente, como se muestra en la tabla.

Paso 2: frecuencia Absoluta


Se procede al conteo o tabulación de cada uno de los datos o valores diferentes utilizando tarjas, luego
se debe contar el número de tarjas, obteniendo de esta manera las frecuencias absolutas.

Nº de libros Interpretación:
Consultados
Conteo f1 = 1 Un estudiante de los 14 encuestados, no consulta
para rendir
fi ningún libro para rendir el examen de estadística.
un examen
xi f2 = 6 Seis estudiantes de los 14 encuestados consultan
0 / 1 un libro para rendir el examen de estadística.
1 ////// 6
f3 = 4 Cuatro estudiantes de los 14 encuestados
2 //// 4 consultan dos libros para rendir el examen de
3 // 2 estadística

4 / 1 f4 = 2 Dos estudiantes de los 14 encuestados consultan


tres libros para rendir el examen de estadística
fi = n= 14
f5 = 1 Un estudiante de los 14 encuestados consulta
cuatro libros para rendir el examen de estadística
Paso 3: frecuencia Relativa

Las frecuencias relativas se calculan de la siguiente forma:

𝒇𝒊
𝒉𝒊 =
𝒏 xi fi hi hi %
ℎ1 = 1
= 0,07142857143
0 1 0.07 7
14
1 6 0.43 43
ℎ 6
2=
14
= 0,4285714286 2 4 0.29 29
3 2 0.14 14
ℎ3 = 4
= 0,2857142857
14 4 1 0.07 7
ℎ 2 n= 14  = 1 100%
4= = 0,1428571429
14

ℎ5 = 1
= 0,07142857143
14
Interpretación:

h1 = 0,07 Es la proporción de estudiante de los 14 encuestados que no consulta ningún libro para rendir
el examen de estadística.

h2 = 0,43 es la proporción de estudiantes de los 14 encuestados que consultan un libro para rendir el
examen de estadística.

h3 = 0,29 Es la proporción de estudiantes de los 14 encuestados que consultan dos libros para rendir el
examen de estadística

h4 = 0,14 Es la proporción de estudiantes de los 14 encuestados que consultan tres libros para rendir el
examen de estadística

h5 = 0,07 es la proporción de estudiante de los 14 encuestados que consultan cuatro libros para rendir el
examen de estadística

h1 % = 7 % de los estudiantes encuestados no consulta ningún libro para rendir el examen de


estadística.

Paso 4: Frecuencias Absolutas Acumuladas menor que


Interpretación:
xi fi Fi
F1 = 1 estudiante no consulta ningún libro para rendir el examen
0 1 1 de estadística.

1 6 7 F2 = 7 estudiantes consultan 1 ó menos libros para rendir el


examen de estadística.
2 4 11 F3 = 11 estudiantes consultan 2 ó menos libros para rendir el
examen de estadística
3 2 13
F4 = 13 estudiantes consultan 3 libros ó menos para rendir el
4 1 14 examen de estadística

n= 14 F5 = 14 estudiante encuestados consulta 4 libros ó menos para


rendir el examen de estadística
Paso 5: Frecuencia Absoluta Acumulada mayor que

Interpretación: xi fi Fi Fi
F1 = 14 estudiante consultan entre 0 y 4 libros para rendir el 0 1 1 14
examen de estadística.
1 6 7 13
F2 = 13 estudiantes consultan 1 ó más libros para rendir el
examen de estadística. 2 4 11 7
F3 = 7 estudiantes consultan por lo menos 2 libros para rendir el
3 2 13 3
examen de estadística

F4 = 3 estudiantes consultan 3 libros ó más para rendir el examen 4 1 14 1


de estadística
n= 14
F5 = 1 estudiante encuestados consulta 4 para rendir el examen
de estadística
Paso 6: Frecuencia Relativa Acumuladas menor que

xi fi hi Hi Interpretación:
0 1 0.07 0.07 H1 = 0.07 es la proporción de estudiante que no consultan
ningún libro para rendir el examen de estadística.
1 6 0.43 0.50
H2 = 0.50 es la proporción de estudiantes que consultan 1 ó
2 4 0.29 0.79 menos libros para rendir el examen de estadística.

3 2 0.14 0.93 H3 = 0.79 es la proporción de estudiantes que a lo más 2 libros


para rendir el examen de estadística
4 1 0.07 1
H4 = 0.93 es la proporción de estudiantes encuestados que
n= 14 1 consultan 3 ó menos libros para rendir el examen de estadística

H5 = 1 es la proporción de estudiante encuestados que consultan


4 ó menos libros para rendir el examen de estadística

Paso 7: Frecuencia Relativa Acumulada mayor que

xi fi hi Hi Interpretación:

0 1 0.07 1 H1 = 1 es la proporción de estudiante que consultan entre 0 y 4


libros para rendir el examen de estadística.
1 6 0.43 0.93
H2 = 0.93 es la proporción de estudiantes que consultan 1 ó más
2 4 0.29 0.50 libros para rendir el examen de estadística.

H3 = 0.50 es la proporción de estudiantes que consultan por lo


3 2 0.14 0.21
menos 2 libros para rendir el examen de estadística
4 1 0.07 0.07 H4 = 0.21 es la proporción de estudiantes consultan 3 libros ó
más para rendir el examen de estadística
n= 14 1
H5 = 0.07 es la proporción de estudiante encuestados consulta 4
para rendir el examen de estadística

2.3 TABLA DE DISTRIBUCIÓN DE FRECUENCIAS - DATOS DE VARIABLES DISCRETAS


Este tipo de tablas se utiliza cuando se dispone de pocos datos, y además si la variable en estudio es
discreta.

Ejemplo:

Las notas obtenidas sobre 10 puntos en un examen de Matemática financiera realizado la semana
anterior, fueron los siguientes:

4 5 7 5 8 3 9 6 4 5

7 5 8 4 3 10 3 6 6 3
xi fi hi hi % Fi Fi Hi Hi
3 4 0.2 20 4 20 0.2 1
4 3 0.15 15 7 16 0.35 0.8
5 4 0.2 20 11 13 0.55 0.65
6 3 0.15 15 14 9 0.70 0.45
7 2 0.1 10 16 6 0.80 0.30
8 2 0.1 10 18 4 0.90 0.20
9 1 0.05 5 19 2 0.95 0.10
10 1 0.05 5 20 1 1 0.05
n= 20 1 100%

2.4 TABLA DE DISTRIBUCIÓN DE FRECUENCIAS - DATOS DE VARIABLES CONTINUAS

Ejemplo:

Los siguientes datos corresponden a las notas obtenidas por un curso de 24 alumnos en un trabajo de
contabilidad.

3,2 4,2 5,6 6,0 2,8 3,9 4,2 4,2 5,0

5,0 3,9 3,9 3,2 3,2 4,2 5,6 6,0 6,0

3,2 6,0 4,2 5,0 5,6 5,0

xi fi hi hi % Fi Fi Hi Hi
2,8 1 0.04 4 1 24 0.04 1
3,2 4 0.17 17 5 23 0.21 0.96
3,9 3 0.12 12 8 19 0.33 0.79
4,2 5 0.21 21 13 16 0.54 0.67
5,0 4 0.17 17 17 11 0.71 0.46
5,6 3 0.12 12 20 7 0.83 0.29
6,0 4 0.17 17 24 4 1 0.17
n =24 1 100%

2.5 TABLA DE DISTRIBUCIÓN DE FRECUENCIAS - DATOS DE VARIABLES CUALITATIVAS

Ejemplo:

MUESTRA: 70 Libros de una biblioteca pública de la Comunidad

VARIABLE: Género

Narrativa Biografía Poesía Cuento Biografía Narrativa Cuento


Cuento Poesía Biografía Poesía Narrativa Narrativa Teatro
Poesía Biografía Narrativa Poesía Biografía Narrativa Cuento
Narrativa Poesía Poesía Narrativa Poesía Poesía Narrativa
Narrativa Biografía Narrativa Biografía Biografía Narrativa Poesía
Teatro Biografía Narrativa Teatro Narrativa Biografía Cuento
Poesía Poesía Narrativa Poesía Biografía Narrativa Poesía
Narrativa Poesía Poesía Narrativa Teatro Teatro Poesía
Biografía Narrativa Poesía Narrativa Poesía Biografía Narrativa
Poesía Narrativa Narrativa Teatro Teatro Biografía Biografía

Se pide realizar la clasificación y representación de la información

Variable
Género fi hi hi % Fi Fi Hi Hi
literario
Narrativa 23 0,33 33 23 70 0.33 1
Biografía 15 0,21 21 38 47 0.54 0.67
Poesía 20 0,29 29 58 32 0.83 0.46
Teatro 7 0,10 10 65 12 0.93 0.17
Cuento 5 0,07 7 70 5 1 0.07

n =70 1 100%

También podría gustarte