Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TOS.
LOGRO DE LA SESIÓN
Al finalizar la sesión de clase el estudiante comprende la importancia de organizar y presentar los datos de
manera adecuada.
Una vez recopilada la información, lo mas conveniente es resumirlos y ordenarlos en una tabla de distribución de
frecuencias, para luego presentarlos en gráficos, esto permitirá obtener conclusiones para la toma de decisiones.
Una tabla de distribución de frecuencias es una tabla donde se presentan los diferentes valores de la variable en
clases, con sus correspondientes frecuencias absolutas, relativas y porcentuales.
Las tres frecuencias que se definen a continuación se pueden calcular para cualquier tipo de variable que se ha
estudiado en la sección anterior.
Es la razón entre el número de elementos que pertenecen a una clase y el número de elementos de la mues-
tra. Se representa simbólicamente por h i .
fi
hi =
n
Es la frecuencia relativa multiplicada por 100 %, representa el porcentaje de elementos de la muestra que
pertenecen a una clase. Se representa simbólicamente por p i .
p i = h i × 100 %
Ejemplo 2.1
El coordinador de bienestar estudiantil de la Universidad de Ciencias Aplicadas aplicó una encuesta a una
muestra de cuarenta estudiantes, con el objetivo de conocer algunas características de dichos estudiantes.
Las preguntas realizadas se relacionaron con las variables:
1. Edad de un estudiante.
2. Sexo de un estudiante.
Con las respuestas se elaboró la siguiente base de datos que se presenta en Excel, cuyo nombre es: Base de
datos Bienestar Estudiantil.
Nº Edad Sexo Estado civil Carrera Créditos Percepción Tiempo que escucha música Gasto en pasajes
1 20 Varón Soltero Ing. Civil 18 Bueno 3.0 4.5
2 26 Varón Soltero Ing. Industrial 22 Bueno 2.5 2.0
3 17 Varón Viudo Ing. Mecánica 20 Bueno 3.0 4.0
4 17 Varón Soltero Ing. Industrial 16 Regular 1.5 3.0
5 18 Mujer Soltero Ing. Mecánica 19 Regular 5.0 5.0
6 27 Varón Soltero Derecho 20 Regular 2.0 10.0
7 16 Varón Soltero Ing. Civil 20 Bueno 2.0 7.0
8 23 Varón Soltero Ing. Mecánica 18 Regular 3.5 5.0
9 21 Mujer Soltero Ing. Sistemas 18 Bueno 2.5 2.8
10 31 Varón Soltero Ing. Civil 20 Bueno 4.0 4.6
11 27 Mujer Soltero Ing. Industrial 20 Regular 2.5 5.0
12 23 Varón Soltero Ing. Civil 20 Regular 3.0 8.0
13 23 Mujer casado Ing. Industrial 22 Deficiente 3.0 5.6
14 17 Varón casado Ing. Civil 20 Deficiente 2.5 2.8
15 27 Varón casado Contabilidad 19 Muy bueno 3.0 8.8
16 28 Varón casado Derecho 18 Bueno 3.5 9.0
17 26 Mujer casado Ing. Mecánica 19 Bueno 2.0 4.0
18 23 Mujer casado Ing. Industrial 22 Muy bueno 1.5 5.8
19 18 Mujer casado Ing. Mecánica 20 Regular 2.5 5.6
20 29 Varón casado Ing. Industrial 18 Regular 4.0 4.0
21 20 Mujer casado Derecho 18 Bueno 2.5 3.0
22 15 Mujer casado Ing. Industrial 21 Deficiente 3.0 4.8
23 30 Varón casado Ing. Mecánica 23 Muy bueno 3.5 8.0
24 18 Mujer Soltero Contabilidad 22 Bueno 3.0 5.6
25 17 Mujer conviviente Ing. Civil 20 Bueno 3.5 2.8
26 23 Varón Soltero Ing. Industrial 21 Bueno 3.0 5.0
27 19 Mujer conviviente Ing. Civil 19 Regular 3.0 10.0
28 16 Varón Soltero Ing. Mecánica 19 Bueno 3.5 7.0
29 17 Mujer conviviente Ing. Sistemas 19 Regular 4.5 5.0
30 16 Varón conviviente Contabilidad 18 Bueno 4.5 2.8
31 22 Mujer Soltero Derecho 18 Bueno 0.5 4.6
32 18 Varón Soltero Contabilidad 18 Muy bueno 2.5 5.0
33 23 Varón Soltero Ing. Industrial 20 Bueno 4.5 8.0
34 20 Mujer Soltero Ing. Civil 22 Muy bueno 2.0 5.6
35 22 Mujer Soltero Ing. Industrial 20 Muy bueno 3.0 2.8
36 23 Varón Soltero Ing. Civil 20 Regular 3.0 8.8
37 18 Varón Soltero Ing. Industrial 20 Regular 5.0 9.0
38 19 Mujer Soltero Ing. Civil 22 Bueno 2.5 3.8
39 16 Varón Soltero Ing. Mecánica 19 Bueno 3.5 7.0
40 18 Mujer Soltero Ing. Mecánica 19 Regular 2.5 5.0
Para la obtención de los datos se tuvo mucho cuidado, previamente en la población se observó la distri-
bución de los estudiantes por sus carreras, por sexo, tamaño adecuado de la muestra, etc. Finalmente, se
tomó cada uno de los elementos de la muestra al azar. Teniendo en cuenta estos cuidados podemos decir
que la muestra es representativa y adecuada ya seguramente que describe fielmente las características de
la población.
b. Utilizando Microsoft Excel, organice los datos en una tabla de distribución de frecuencias y realice su
respectivo gráfico. (indicar título y fuente).
d. ¿Cuántos estudiantes respondieron que estudian la carrera de ingeniería industrial? ¿Como se llama
la frecuencia que ayuda a responder a esta pregunta?
e. ¿Cuál es la proporción de estudiantes que respondieron que estudian la carrera de derecho? ¿Como
se llama la frecuencia que ayuda a responder a esta pregunta?
A continuación, se dan las definiciones de los tres tipos de frecuencias acumuladas. Estas frecuencias acumuladas
no tiene sentido calcularlas cuando la variable es de tipo cualitativa nominal.
La frecuencia absoluta acumulada es el número de veces que ha aparecido en la muestra un valor menor o
igual que el de la variable. Se representa simbólicamente por F i y se calcula de la siguiente manera.
k
X
Fk = fi
i =1
F1 = f1
F2 = F1 + f 2 = f 1 + f 2
F3 = F2 + f 3 = f 1 + f 2 + f 3
..
.
Fk = F k−1 + f k = f 1 + f 2 + · · · + f k
Donde k indica el número de clases o intervalos en los cuales se está agrupando los datos.
Es la razón del número de valores menores o iguales que el valor de la variable y el número de elementos de
la muestra. Se representa simbólicamente por Hi y se calcula de la siguiente manera.
Fi
Hi =
n
Esta frecuencia relativa acumulada también se puede calcular de la siguiente forma:
k
X
Hk = hi
i =1
H1 = h1
H2 = H1 + h 2 = h 1 + h 2
H3 = H2 + h 3 = h 1 + h 2 + h 3
..
.
Hk = Hk−1 + h k = h 1 + h 2 + · · · + h k
Es el porcentaje de valores menores o iguales que el valor de la variable. Se representa simbólicamente por
P i y se calcula de la siguiente manera.
P i = Hi 100 %
P1 = p1
P2 = P1 + p2 = p1 + p2
P3 = P2 + p3 = p1 + p2 + p3
..
.
Pk = P k−1 + p k = p 1 + p 2 + · · · + p k
Cuando la variable es cuantitativa continua y si es necesario agrupar los datos, esto se realiza por intervalos, tam-
bién se agrupa por intervalos cuando la variable es cuantitativa discreta pero con muchas categorías (generalmen-
te más de 20). Para construir la distribución de frecuencias por intervalos existen varios procedimientos, nosotros
utilizaremos la técnica que se desarrolla lineas abajo, donde el número de intervalos recomendable no debe supe-
rar a 20 ni inferior a 5, consideraremos también la amplitud de los intervalos igual para todos, lo que no siempre
es así.
Sean n valores de alguna variable cuantitativa continua X , podemos agrupar los datos usando los siguientes pa-
sos:
R = x max − x mi n
donde:
x max : es el mayor de los datos observados.
x mi n : es el menor de los datos observados.
II Determinar el número de intervalos (k), que está definido por la regla de Sturges:
k = 1 + 3.3 log(n)
III Determinar la amplitud del intervalo (C ), se obtiene dividiendo el rango entre el número de interva-
los, como sigue:
R
C=
k
Importante:
La amplitud C se aproxima por exceso de manera que se cubra todo el rango, ya que se debe
tener kC > R, dicho exceso debe ser lo mínimo posible.
Si los datos son enteros C puede ser entero, si los datos tienen un decimal C tiene al menos un
decimal, etc. Por ejemplo, si los datos tienen dos decimales y si C = Rk = 5.3416, se elige C = 5.35
y no 5.34.
I1 = [x mi n ; x mi n +C [
I2 = [x mi n +C ; x mi n + 2C [
I 3 = [x mi n + 2C ; x mi n + 3C [
..
.
Ik = [x mi n + (k − 1)C ; x mi n + kC [
Es la denominación que se le da al punto medio de un intervalo en una tabla de frecuencias de datos agru-
pados. Hay tantas marcas de clase como intervalos tenga la variable. Simbólicamente se representa por x i .
L i n f + L sup
xi =
2
donde L i n f y L sup es el límite inferior y superior del intervalo i -ésimo.
La marca de clase es el número que representa a todos los datos contenidos en el intervalo.
Ejemplo 2.2
Utilizando el archivo en Excel “Base de datos Bienestar Estudiantil”, para la variable monto que gasta un
estudiante en pasajes en un día (en soles).
b. Utilizando Microsoft Excel, organice los datos en una tabla de distribución de frecuencias con una
amplitud de 1.4 soles y elabore un histograma. (indicar título y fuente)
c. ¿Cuántos estudiantes de la muestra gastan en sus pasajes desde 6.2 soles a menos de 7.6 soles? Indique
la frecuencia usada para responder a la pregunta.
d. ¿Que porcentaje de estudiantes gastan en sus pasajes desde 2.0 soles a menos de 4.8 soles? Justifique
su respuesta.
e. ¿Cuántos estudiantes gastan en sus pasajes menos de nueve soles? Indique la frecuencia usada para
responder la pregunta.
f. ¿Cuál es aproximadamente el porcentaje de estudiantes que gastan menos de 6.55 soles? Justifique su
respuesta.
h. ¿Cuántas marcas de clase posee la distribución de frecuencias? Calcule cada una de estas marcas de
clase e indique lo que representan.
Ejemplo 2.3
Parte de un estudio de control de calidad tuvo como objetivo mejorar una línea de producción, se midieron
los pesos (en onzas) de 25 barras de jabón. Los resultados son los siguientes, ordenados del más pequeño al
más grande.
11.6; 12.7; 13.1; 13.6; 14.1; 14.3; 14.6; 15.1; 15.6; 15.8; 15.8; 15.9; 16.2; 16.3; 16.5; 16.5; 17.0; 17.3; 17.4; 17.6;
17.7; 18.3; 18.3; 18.5; 20.3.
k = 1 + 3.3 log(n)
= 1 + 3.3 log(25)
= 5.6132.
d. Graficar un histograma
. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................
g. Graficar la Ojiva
. ..........................................................................................................
. ..........................................................................................................
. ..........................................................................................................
EJERCICIOS ADICIONALES
2. La compañía de estudios de mercado INFLUYE tiene la necesidad de conocer el tipo de red social que
usan los habitantes de cierta población, para responder a esta interrogante se tomó una muestra de 50
habitantes a quienes se les preguntó por la red social que con mayor frecuencia usan, los resultados se
muestran a continuación:
F W I h5 F T I h5 W T W F T W I W F T W F
W I F F F F F W W W F I F F F W I F W I
I W I F I F F W F F
Donde:
F: Facebook W: Whatsapp
I: Instagram h5: hi5
T: Twitter
3. Un investigador al tratar de conocer la motivación que han tenido los estudiantes para estudiar una carre-
ra universitaria, en el cuestionario que está utilizando agregó la siguiente afirmación: Voy a la universidad
porque los estudios me permitirán aprender muchas cosas que me interesan. Sobre esta afirmación los
estudiantes dieron su opinión de la siguiente forma:
1:Totalmente de acuerdo, 2: Muy de acuerdo, 3: Bastante de acuerdo, 4: Medio de acuerdo, 5: Poco de acuer-
do, 6: Muy poco de acuerdo.
La encuesta a cuarenta estudiantes dio el siguiente resultado:
1 1 3 1 2 1 1 1 1 2 1 2 1 1 1 2 1 1 1 1
2 1 2 1 1 5 1 6 1 1 4 1 6 1 1 1 1 1 1 6
a. Indique la variable.
b. Construya la tabla de distribución de frecuencias. (Tenga cuidado con el orden ya que la variable es
del tipo cualitativa ordinal)
4. El ingeniero Elmer Días es el supervisor de mantenimiento de aeronaves. Una entrega reciente de pernos
por parte de un nuevo proveedor llamó la atención de uno de los empleados. El ingeniero Días envió
una muestra de 25 de esos pernos a un laboratorio de pruebas para determinar la fuerza necesaria para
romperlos. A continuación presentamos los resultados en miles de libras de fuerza:
157.8 147.4 135.2 151.1 155.7 152.0 140.8 139.8 151.2 144.9
129.9 143.3 152.3 148.7 135.7 135.0 138.9 152.0 127.6 143.0
161.6 135.7 136.3 150.9 148.2
5. En la siguiente tabla se muestra las calificaciones de 120 alumnos del curso de estadística. Asuma que la
amplitud de los intervalos es igual para todos.
Calificación fi hi Fi Hi pi Pi
0.15
[6, [ 0.45
70 %
[15, [ 0.1
Total
a. Indique la variable.
b. Complete la tabla.
c. ¿Cuántos alumnos salieron aprobados con calificación mínima 12?
d. ¿Cuál es el porcentaje de estudiantes que desaprobaron?
e. Si el estudiante tiene calificación de 17 o más es sobresaliente ¿Qué porcentaje de estos estudiantes
son sobresalientes?
f. Calcule las marcas de clase.
6. En la ciudad de Arequipa se construirá una vía rápida que conectará el cono norte y el cono sur de la
ciudad. Para estudiar el impacto que tendrá sobre los conductores, se tomó una muestra de 25 calles de
las más transitadas, en donde se observó la cantidad de vehículos que transitaban por cada minuto. Los
resultados de la observación se muestran a continuación.
10 12 13 14 10 13 15 13 15 12 11 13 14 13 12
14 11 12 11 11 14 12 14 14 15
TAREA DOMICILIARIA
1. Según la Asociación de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que
la delgadez sea sinónimo de éxito social. Muchos jóvenes luchan para conseguir el “físico ideal” motivados
por modelos, artistas o por la publicidad comercial. Durante el mes de marzo del año 2012, en el colegio
“Alcántara” de la ciudad de Talca, después de las vacaciones de verano, se observó con precaución a 25
alumnos con síntomas de anorexia, registrándose los siguientes signos visibles:
Dieta severa Miedo a engordar Hiperactividad Hiperactividad Miedo a engordar
Uso de ropa holgada Dieta severa Uso de laxantes Uso de laxantes Uso de ropa holgada
Miedo a engordar Dieta severa Uso de ropa holgada Uso de laxantes Uso de laxantes
Dieta severa Uso de ropa holgada Dieta severa Uso de ropa holgada Dieta severa
Dieta severa Dieta severa Uso de ropa holgada Uso de laxantes Hiperactividad
2. La tabla muestra la distribución del ingreso familiar (diario en soles) correspondiente a 80 familias, la am-
plitud de clase o intervalo es igual para todos.
Ingreso Familiar (soles) fi Fi hi Hi pi Pi
[ 160 – [
[ – [ 48 60
[ – [ 0.125
[ – [ 0.075
[ – 210[
Total
4. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribución de
frecuencias simétrica de cinco intervalos de igual amplitud, resultando: Ingreso mínimo $ 120, marca del
clase del cuarto intervalo x 4 = $ 295. Si el 8 % de los ingresos son menores que $ 160 y el 65 % de los ingresos
son menores a $ 270. (Sugerencia: utilice interpolación)