Está en la página 1de 14

Cultura Estadística

para la Investigación

2017
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

SESIÓN N° 08

“PROCESAMIENTO Y ORGANIZACIÓN DE LA
INFORMACIÓN”

1. ORGANIZACIÓN DE LOS DATOS


1.1. DISTRIBUCIÓN DE FRECUENCIAS.
Luego de la recopilación de los datos, es necesario que los datos sin tratar se les debe
sintetizar o resumir de manera que sea posible interpretarlos, entenderlos y utilizarlos. Para
ello, se hace uso cuadros numéricosy luego se representan en gráficos.

Todo cuadro numérico debe tener los siguientes elementos:


 Un título adecuado y breve.
 La fuente de los datos (de donde provienen los datos).
 Las unidades en que se expresan los datos.

Los cuadros numéricos de una sola variable estadística se denominan distribución de


frecuencias.

1.1.1. Distribución De Frecuencias: Variable Cualitativa


Supongamos que en una muestra de “n” unidades estadísticas se observan k categorías
o modalidades diferentes C1,C2,...,Ck, de alguna variable cualitativa X. La tabulación de
estos “n” datos, es la distribución de frecuencias por categorías del cuadro 1.

 Lafrecuencia absoluta (fi), el número de veces que aparece un determinado valor


(categoría o modalidad) en un estudio estadístico. La suma de todas las frecuencias
absolutas es igual al total nde datos observados.
 Lafrecuencia relativa (hi) se define en cada categoría por hi  fi n .La suma de todas
las frecuencias relativas es igual a uno.
 Lafrecuencia porcentajepi se define en cada fila por pi  hi 100% . El total de las
frecuencias porcentajes es igual a cien.

2
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

Cuadro 1. Distribución de frecuencias de variable cualitativa


Categorías de la Frecuencias Frecuencias Frecuencias
Variable X Absolutas Simples f i Relativas Simples hi Porcentajes pi
C1 f1 h1 p1
C2 f2 h2 p2
... ... ... ...
Ck fk hk pk
Total N 1.00 100.00

Fuente:

EJEMPLO

En una entrevista practicada a una muestra de 40 alumnos sobre el temor de hablar en


público, se obtuvo el resultado siguiente:

M M N P N P N P P M M P P M N P N M P M P P P M
P M M P M P P M M P N N P M P N

Dónde: M = Mucho P = Poco N = Nada.

Elabore una tabla o cuadro de distribución de frecuencias.

Solución.

La tabulación de estos datos, donde la variable cualitativa es X: Intensidad de temor


para hablar en público, es la distribución de frecuencias de la tabla siguiente:

Cuadro N° 01: Distribución de alumnos de acuerdo al temor para hablar en público.


Intensidad de Número de Frecuencias Frecuencias
Temor Señoritas; fi relativas: hi Porcentajes: pi (%)
M: Mucho 14 0.35 35
P: Poco 18 0.45 45
N: Nada 08 0.20 20
Total 40 1.00 100
Fuente. Datos obtenidos de la entrevista realizada.

1.1.2. GRÁFICAS PARA UNA VARIABLE CUALITATIVA.

Existe una gran variedad de gráficas para la distribución de frecuencias de variable


cualitativa, las más comunes son la de barras y la de sectores circulares.

3
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

En una gráfica de barras los datos de cada una de las categorías C i se representan por
una barra rectangular vertical (u horizontal), cuya altura (o largo) es proporcional a su
frecuencia (absoluta o relativa). Las barras se dibujan dejando un espacio entre ellas.

GRAFICA N° 01: Distribución de alumnos según la intensidad del temor al hablar en


público
Distribución de alumnos
45%

45% 35%
40%
35%
30% 20%
25%
20%
15%
10%
5%
0%
Mucho Poco Nada
Temor

Fuente. Datos obtenidos de la entrevista realizada

En una gráfica circular, los datos de cada categoría C i se representan por un sector
circular cuya a medida de cada ángulo es proporcional a la frecuencia relativa simple de
la categoría que representa (hi360°).

GRAFICA N° 02: Distribución de alumnos según la intensidad del temor al hablar en


público

20%
35%
Mucho
Poco
Nada

45%

Fuente. Datos obtenidos de la entrevista realizada

Ejemplo en Clase. A continuación se presentan los resultados de un estudio de mercado realizado en


el presente mes por el área de Marketing de la empresa Maxell, cuyo fin es determinar la actitud de
compra delos consumidores trujillanos ante un producto que se lanzará en el mercado.
si si si no si no si no si si
si si si si si no no si si si
no si si si si si no no si si
si no no si si si no si no si
si si si si si si si no si si
Construya con estos resultados un cuadro de distribución de frecuencias y un gráfico estadístico.
Interprete sus resultados teniendo en cuenta que la empresa decidirá lanzar el producto al mercado
4
si es que los resultados muestran que el porcentaje de aceptación supera los 75%.
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

1.1.3. DISTRIBUCIÓN DE FRECUENCIAS: VARIABLE CUANTITATIVA DISCRETA


Suponga que se han recolectado n valores de alguna variable discreta X. El
procedimiento más simple de organizar estos “n”datos, consiste en ordenar estos
valores numéricos en forma ascendente.

Si los “n” datos se repiten, y si al terminar el ordenamiento se obtienen k ( k  n )


valores distintos de X, digamos, x1 , x2 ,..., x k , con frecuencias absolutas respectivas
f1 , f 2 ,..., f k , la distribución de frecuencias de estos n datos se resume en el cuadro 2
(observar que es similar al cuadro 1)

 Las frecuencias absolutas y relativas poseen, en el caso de variable discreta, el


mismo significado y propiedades, que en el caso de la variable cualitativa.

 La frecuencia absoluta acumulada, Fi es la suma de las frecuencias absolutas de los


i
valores menores o iguales a x i , esto es, Fi  f
j =1
j, i  1,2,..., k .

 La frecuencia relativa acumulada H i , se define por:


i

h
Fi
Hi  j o Hi  , i  1,2,3,..., k . .
j =1 n

Cuadro 2. Distribución de frecuencias de variable discreta


Valores de Frecuencias Frecuencias Frecuencias Frecuencias
Absolutas Relativas
La variable X Absolutas f i Relativas hi Acumuladas Fi Acumuladas Hi
x1 f1 h1 F1 = f1 H1 = h1
x2 f2 h2 F2 = f1 + f2 H2 = h1 + h2
... ... ... … …
xk fk hk Fk = f1 + … + fk = n Hk = h1 + … + hk = 1
Total N 1.00 ---------- --------------

Fuente:

Ejemplo:
Supóngase que ante la pregunta del número asignaturas reprobadas (variable X) por un
grupo de alumnos de una Facultad, se tiene las siguientes respuestas:

2, 1, 0, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 0, 4, 1, 0, 1, 3, 3.

Si se ordenan los datos en forma ascendente, se obtienen cinco valores distintos 0, 1, 2,


3, 4 que se repiten respectivamente 4, 6, 5, 8, 2 veces, entonces, la distribución de
frecuencias de se da en la tabla siguiente:

5
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

Cuadro N° 02: Distribución de frecuencias de 25 alumnos según el número de cursos


reprobados
Cursos Frecuencias Frecuencias Frecuencias Frecuencias
reprobados Absolutas Relativas Absoluta Relativa
Xi fi hi acumulada Fi acumulada Hi
0 4 0.16 4 0.16
1 6 0.24 10 0.40
2 5 0.20 15 0.60
3 8 0.32 23 0.92
4 2 0.08 25 1.00
Total 25 1.00
Fuente. Datos obtenidos de los formularios de la encuesta.

Descripción
f1 = 4, significa que 4 alumnos concluyeron sus estudios en forma invicta.
h3 = 0.20, significa que 1 de cada 5 alumnos reprobó 2 cursos (5/25 =1/5 = 0.20)
h5 = 0.08, significa que el 8% de alumnos reprobó 4 asignaturas.
F3 = 15, significa que 15 alumnos reprobaron 2 o menos asignaturas (menos de 3).
H4 = 0.92, significa que el 92% de alumnos reprobaron 2 o menos asignaturas

1.1.4. GRÁFICAS PARA UNA VARIABLE CUANTITATIVA DISCRETA.

Aquí tenemos: elgráfico de barras, bastones y el sector circular, cabe resaltar que la
representación gráfica más común de una distribución de frecuencias de variable
discreta es del tipobastón queconsiste en trazar en cada valor distinto de la variable,
segmentos de recta proporcionales a su frecuencia.

GRAFICA N° 03: Distribución de frecuencias de 25 alumnos según el número de cursos


reprobados
9
8
8

7
6
6
5
5
4
4

3
2
2

1
0
0 1 2 3 4

Fuente. Datos obtenidos de los formularios de la encuesta.

6
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

Ejemplo en clases.Con la finalidad de otorgar una bonificación para época escolar, se investiga el número de
hijos de una muestra de 40 trabajadores de la Municipalidad de Piura en el presente año, para ello se registra
entre otras características la cantidad de hijos que tiene cada trabajador obteniendo los siguientes resultados:
1 4 5 5 5 5 0 4
5 3 4 1 4 3 0 0
0 0 1 3 3 3 5 6
4 4 1 0 2 2 1 4
2 2 3 5 5 4 1 1

Elaborar un cuadro de distribución de frecuencias y elabore la gráfica adecuada.


¿Cuál es el porcentaje de trabajadores que recibirían el beneficio?

1.1.5. DISTRIBUCIÓN DE FRECUENCIAS: VARIABLE CUANTITATIVA CONTINUA

La distribución de frecuencia por intervalos o clases se usa cuando la variable estadística


es continúa o cuando el número de valores distintos de una variable discreta es grande
(CORDOVA M. , 2001).

Construcción de la distribución de frecuencias


Dados n valores de alguna variable cuantitativa X uno de los métodos para construir la
distribución de frecuencias es:
1. Determinar el rango (R) de variación de los datos que se define por

R  X max  X min

Donde X max es el dato máximo y X min es el dato mínimo.

2. Determinar el número de intervalos (k): Un valor aproximado del número de


intervalos, k, nos proporciona la regla de Sturges, donde,

k = 1 + 3.322log(n),
Se redondea a datos enteros.
3. Determinar la amplitud A del intervalo, dividiendo el rango entre el número de
intervalos. Esto es, A  R k

Si la división A  R k no es exacta en el número de decimales de los datos,


entonces, el número Ase aproxima porexceso.

7
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

Si los datos son enteros, A es entero, si los datos tienen un decimal, A tiene un
decimal, etc. Por ejemplo, si los datos tienen dos decimales y si R / k  5.3416,
se elige A  5.35. (no 5.34).
4. Determinar los extremos de los intervalos de la siguiente manera:

I 1  [ X min , X min  A[

I 2  [ X min  A, X min  2 A[



I k  [ X min  (k  1) A, X min  kA 

Cuadro 3. Distribución de frecuencias por intervalos

Frecuencias Frecuencias Frecuencias


Frecuencias
Intervalos Marca de Absolutas Absolutas Relativa
Relativa
Ii Clase (Xi) Simples Acumuladas Acumulada
Simple hi
fi Fi Hi

[ LI1 – LS1 > x1 f1 h1 F1 = f1 H 1 = h1

[ LI2 – LS2 > x2 f2 h2 F2 = f1 + f2 H 2 = h1 +h2

... ... ... ... ... ...

[ LIk – LSk > XK fk hk Fk = n Hk = 1

Total N 1.00 …. ….

Definición: La marca de clase o marca del intervalo xique se define como el punto
medio del intervalo. Esto es,

𝐿𝑆𝑖 + 𝐿𝐼𝑖
𝑋𝑖 =
2

Ejemplo
Para esclarecer la construcción de la tabla de frecuencias para datos agrupados en
intervalos de clase, desarrollaremos el siguiente ejemplo. Los datos corresponden a los
años de servicio un conjunto de trabajadores en una empresa.

8
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

15 12 12 15 16 16 17 10 11 14 17 11 13 12 12 15 10 13 15 13 11
17 16 12 12 13 11 13 11 10 12 9 14 13 14 14 14 11 11 13 12 15
12 10 13 13 14 10 8 15

Solución:

Construcción de Intervalos

Donde valor mínimo Xmin = 8 ; valor máximo Xmáx = 18

1. Rango:
R = 18 – 8 = 10
2. Numero de Intervalos:
k = 1 + 3.322log(50) = 6.64.. = 7
3. Amplitud de intervalos:
A = 10/7 = 1.4285… = 2

4. Intervalos

Intervalos Conteo
[ 08 ; 10> // 2
[ 10 ; 12> //// - //// - // 12
[ 12 ; 14> //// - //// - //// - /// 18
[ 14 ; 16> //// - //// - // 12
[ 16 ; 18> //// 5
[ 18 ; 20> /1
[ 20 ; 22] 0

Cuadro N°03. Distribución de frecuencias de 50 trabajadores de una empresa, según


años de servicio.
Intervalo de Marca de Frecuencia Frecuencia Frecuencia Frecuencia
clase clase absoluta Relativa acumulada acumulada
 X X 
´´
i 1 i
´´ X i f i hi Absoluta: Fi Relativa: Hi

8 - 10 9 2 0.04 2 0.04
10 - 12 11 12 0.24 14 0.28
12 - 14 13 18 0.36 32 0.64
14 - 16 15 12 0.24 44 0.88
16 a más 17 6 0.12 50 1.00
Total 50 1.00
Fuente. Registro de la empresa

Descripción.-
f2 = 12, significa que 12 trabajadores tienen 10 años y menor a 12 años.
F4 = 44, significa que 44 trabajadores tienen menos de 16 años de servicio

9
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

h3 = 0. 36, significa que el 36% de los trabajadores tienen entre 12 años a menos de 14
años de servicio
H4 = 0.88, significa que el 88% del total de trabajadores tienen menos de 16 años de
servicio
F4 - F2 = 44 -14 = 30 trabajadores tienen más de 12 años pero menos de 16 años de
servicio
1.1.6. GRÁFICA DE LA DISTRIBUCIÓN POR INTERVALOS
La distribución de frecuencias se representa gráficamente por medio de un
histograma, o de un polígono de frecuencias.A partir del polígono de frecuencias se
puede trazarla curva de frecuencias.

HISTOGRAMA
Es una gráfica de barras rectangulares verticales unidas. La base de cada barra es
proporcional a la amplitud del intervalo, y la altura es proporcional a su frecuencia
(absoluta, o relativa, o porcentaje).

En el eje vertical se colocan las escalas de las frecuencias.En el eje horizontal se colocan
las escalas de la variable. Los números representativos de la escala de los intervalos son
generalmente las marcas de Clase de cada intervalo. Aunque también pueden colocarse
los límites de los intervalos.

GRAFICA N° 04.Distribución de los trabajadores de la empresa (Cuadro N° 3)

Histograma. Trabajadores de la empresa


18
15
Trabajadores

12
9
6
3
0
7 9 11 13 15 17 19
Años de servicio

Fuente. Registro de la empresa

POLÍGONO DE FRECUENCIAS
Es una gráfica poligonal cerrada , que se obtiene uniendo con segmentos de recta, los
puntos que tienen proporcionalmente como abscisa a la marca de clase (punto medio
de cada intervalo) y como ordenada a la frecuencia respectiva. Se cierra en ambos
extremos en las marcas de clase adyacentes de frecuencia cero.

GRAFICA N° 05.Distribución de los trabajadores de la empresa (Cuadro N° 3)


Polígono. Trabajadores de la empresa
18
15
Trabajadores

12
9
6
10
3
0
7 9 11 13 15 17 19
Años de servicio
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

Fuente. Registro de la empresa


Ejemplo en clases. Los ingresos mensuales en nuevos soles de 45 teléfonos monederos en el mes
de Septiembre del 2015 son:
65 89 46 39 56 64 59 25 78

43 53 70 57 62 43 68 62 35

64 72 52 50 62 60 71 61 65

59 67 77 51 67 51 68 61 81

52 62 76 44 60 56 62 63 70

Construir una distribución de frecuencias por intervalos y elabore un histograma y un polígono de


frecuencias.

11
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

EJERCICIOS
Resuelva los siguientes casos propuestos de forma grupal y presente su informe.

1. El Jefe de Producción de la empresa Coca Cola desea presentar un informe a Gerencia sobre
lo producido durante el mes pasado, para ello tiene 36 reportes de producción de las marcas
de gaseosas producidas en ese mes.
coca cola coca cola coca cola coca cola
coca cola sprite fanta fanta
coca cola inca cola inca cola sprite
fanta fanta fanta inca cola
sprite inca cola coca cola coca cola
inca cola coca cola sprite inca cola
sprite coca cola inca cola inca cola
coca cola inca cola fanta fanta
coca cola inca cola sprite inca cola
Elaborar un cuadro de distribución de Frecuencias, elabore gráficos estadísticos y determine
cuál es la marca de gaseosas que se produjo más veces.

2. En el presente mes se ha decidido investigar el grado de instrucción:Primaria (P) Secundaria


(S) Técnica (T) y Universitaria (U) de 50 trabajadores de la empresa Clean EIRL, se obtuvo los
siguientes resultados:
P T S S S P P U P P
U S S P S S P S U U
T S U T S S U P T T
U S S T P S S T P P
S P P S P P S S S T
Construir un cuadro de distribución de frecuencias, elabore gráficos estadísticos e identifique
el porcentaje de trabajadores que tienen grado de instrucción técnica y universitaria.

3. En un trabajo de Investigación Social, organizado por la Municipal de Piura, los investigadores


desean determinar cuál es el tipo de material de construcción de una vivienda que habitan
los ciudadanos de Piura en el Asentamiento humano “Las Dalias”. Con el fin de realizar un
programa que les beneficiará a dichos pobladores con viviendas de esteras y adobe, se
seleccionó una muestra de 50 viviendas, dando los siguientes resultados:

12
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

Esteras Esteras Esteras Esteras Adobe Noble Adobe Adobe Adobe Esteras
Adobe Adobe Adobe Noble Noble Adobe Noble Adobe Adobe Adobe
Esteras Adobe Esteras Adobe Adobe Adobe Adobe Adobe Adobe Esteras
Noble Adobe Adobe Noble Noble Noble Noble Adobe Noble Adobe
Esteras Adobe Noble Adobe Adobe Adobe Noble Adobe Adobe Esteras
Construir un cuadro de distribución de frecuencias y determine qué porcentaje de viviendas
recibirán el beneficio del programa social y a cuánto ascenderán los gastos por el programa
si se sabe que cada vivienda beneficiada recibirá S/.18000 nuevos soles. Considere un total
de 17300 viviendas.

4. Se revisaron a 50 niños que son atendidos en el área de Odontología del Hospital Regional
en el mes de Febrero del presente año y se encontró que el número de dientes con caries
por niño fueron :
2 2 0 4 0 3 3 4 0 2

5 1 0 3 5 2 4 0 0 3

3 4 4 1 2 1 4 5 0 5

4 3 0 0 4 3 0 1 5 0

5 1 5 5 3 0 1 3 0 2

Construir la distribución de frecuencias, trazar su gráfica e interpretar.

5. Determinar los intervalos de la distribución de frecuencias en cada uno de los siguientes


casos:
a) Datos enteros, X min = 10, X max = 50, y k = 8 intervalos.
b) Datos con dos decimales, X min = 2.55, X max = 3.86, y k = 7.
c) Datos con tres decimales, X min = 0.282, X max = 0.655, y k = 6.

6. La inversión anual, en miles de dólares, de una muestra de 40 pequeñas empresas


farmacéuticas en el Norte del País para el año 2011 fueron:
31 17 27 20 28 10 34 25 4 24

15 39 18 30 41 26 12 46 18 23

36 19 29 37 33 27 27 24 26 31

25 28 33 28 22 23 31 29 35 21
Construir la distribución de frecuencias, trazar sus dos gráficas e interpretar.

7. Se registra el tiempo en minutos a 30 pacientes que se demoran para ser atendidos en la


Clínica Belén, resultando los siguientes:
21.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 11.2 23.9

26.8 22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2

13
MÓDULO: CULTURA ESTADÍSTICA AREA DE
PARA LA INVESTIGACIÓN INVESTIGACIÓN

08.3 21.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1

Construir la distribución de frecuencias, trazar sus dos gráficas e interpretar.

14