Está en la página 1de 17

Universidad del Valle de México

Campus Coyoacán
Programa Semestral Mixto L6
División Ingenierías
Asignatura Estadística descriptiva
Docente: Hernández Coria Luis Eduardo
Carrera: Ing. en Sistemas
Computacionales
Título de la Actividad: A.2 Proyecto
integrador etapa 1
Estudiante: Marin Coba Eleazar Arath
Matricula: 34045014
Fecha de entrega: 20/03/2023

ACTIVIDAD:
PROYECTO INTEGRADOR ETAPA 1

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


Fecha: 20 / 03 / 2023
Nombre del estudiante: Eleazar Arath Marin Coba

Nombre del docente: Hernández Coria Luis Eduardo

El objetivo del Proyecto integrador es conocer y aplicar los recursos estadísticos para
el análisis de los datos obtenidos en una muestra aleatoria.
Se realizará en 2 etapas:
Etapa 1. Análisis de datos mediante estadística descriptiva
Etapa 2. Análisis de datos mediante técnicas de muestreo

METODOLOGÍA PASOS

Durante la construcción del proyecto 1. Reúnete con tu equipo.


integrador van a desarrollar la 2. Revisen el problema propuesto.
metodología basada en problemas, 3. Asignen los roles de los integrantes
consiste en que los participantes del del equipo.
equipo aborden el problema desde una 4. Busquen información sobre soluciones
visión de análisis, búsqueda y que se han aplicado en otros contextos.
comparación de información en la que 5. Revisen y desarrollen las
elaboren una estrategia para resolverlo tareas estratégicas.
de forma colaborativa. 6. Elaboren un informe con los
procedimientos y resultados obtenidos.
7. Describan la estrategia que
plantearon para resolver el problema.

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


PROBLEMA
El área de bienestar ocupacional de la empresa Automotriz
González realiza una encuesta a cierto número de
empleados a las cuales se les preguntaron sus hábitos de
ocio, principalmente enfocados en el tiempo que dedican en
un día a dos actividades lúdicas.
- Número de horas dedicadas a leer en el día anterior a
la encuesta.
- Número de horas dedicadas a ver televisión en el día
anterior a la encuesta.
- Su situación laboral en el día anterior a la encuesta.
- Número de horas que pasaron realizando alguna
otra actividad en el día anterior de la encuesta.
- Obtiene el sexo y edad del personal.

INTRODUCCIÓN
En la primera etapa de este proyecto integrador, nos adentramos en los conceptos básicos
de la estadística descriptiva mediante el análisis y manipulación de un conjunto de datos.
Para ello, pondremos en práctica lo aprendido en clase sobre cómo elaborar tablas y gráficos
que nos permitan representar estos datos. Además, podremos utilizar herramientas como Excel
para llevar a cabo estas tareas de manera más eficiente y precisa.
TAREAS ESTRATÉGICAS
1. ¿Es fácil determinar cuántos hombres o mujeres se encuestaron?
Justifica tu respuesta.
Si, ya que en mi caso utilice Excel y existe una formula llamada CONTAR.SI,
que lo que hace es contar el número de celdas que cumplen con un
determinado criterio.
Aquí muestro capturas de como utilizo la formula lo cual me permitió de
manera exitosa obtener cuantos hombre o mujeres se encuestaron
a) Primero se introduce el comando CONTAR.SI, después en el primer
parámetro se pone el rango de celdas que vas a contar que sería donde

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


están los varones y las mujeres, después en el último parámetro
específicas que solo quieres que cuente las celdas que contiene la palabra
“Varón” y una vez hecho esto te da el número de varones que fueron
entrevistados.

Aquí se puede visualizar la nomenclatura para la formula en Excel

Y aquí el resultado

b) En el caso de las mujeres es igual solo que cambiamos la palabra varón


por mujer como se muestra en las siguientes capturas.
Nomenclatura

Resultado

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


2. Realiza una tabla de frecuencias para el rubro sexo, situación laboral y edad.
Tabla de frecuencias para el rubro sexo
Aquí se puede visualizar la tabla de frecuencias para el rubro sexo.

En la columna inicial se puede visualizar el factor evaluado, el cual es la categoría de sexo.

En la segunda columna se puede visualizar la frecuencia absoluta tanto de los varones como
de las mujeres lo cual la suma de estas es el resultado de la población que es 350

En la tercera columna se puede visualizar la frecuencia relativa y para calcularla se utiliza la


siguiente formula:
𝒇𝒊
𝒇𝒓𝒊 =
𝒏
En la cuarta columna se puede visualizar la frecuencia absoluta acumulada que es la suma de
la frecuencia absoluta hasta que da el valor total de la población que es 350

La quinta columna muestra la frecuencia complementaria, que es el valor inverso de la


frecuencia acumulada. En otras palabras, indica la proporción de datos restantes a medida
que se avanza en los intervalos y la cantidad de datos disminuye.

Y por último la sexta columna muestra los porcentajes y para calcularlos se utiliza la siguiente
formula:
%𝑖 = (𝑓𝑟𝑖 )(100)

Sexo f fr F Frecuencia %
complementaria
Varón 183 0.52285714 183 350 52.2857143
Mujer 167 0.47714286 350 183 47.7142857
∑ 350 1 0 100

GRÁFICA DE FRECUENCIA
185 183

180

175
Frecuancias

170
167

165

160

155
Varón
1 2
Mujer
Sexo

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


Tabla de frecuencias para el rubro situación laboral
Aquí se puede visualizar la tabla de frecuencias para el rubro situación laboral.

En la columna inicial se puede visualizar el factor evaluado, el cual es la categoría de situación


laboral.

En la segunda columna se puede visualizar la frecuencia absoluta del factor evaluado de la


primera columna.

En la tercera columna se puede visualizar la frecuencia relativa y para calcularla se utiliza la


siguiente formula:
𝒇𝒊
𝒇𝒓𝒊 =
𝒏
En la cuarta columna se puede visualizar la frecuencia absoluta acumulada que es la suma de
la frecuencia absoluta hasta que da el valor total de la población que es 350

La quinta columna muestra la frecuencia complementaria, que es el valor inverso de la


frecuencia acumulada. En otras palabras, indica la proporción de datos restantes a medida
que se avanza en los intervalos y la cantidad de datos disminuye.

Y por último la sexta columna muestra los porcentajes y para calcularlos se utiliza la siguiente
formula:
%𝑖 = (𝑓𝑟𝑖 )(100)

Situación f fr F Frecuencia %
laboral complementaria
Desempleado 116 0.33142857 116 350 33.1428571
Inactivo 107 0.30571429 223 234 30.5714286
Ocupado 127 0.36285714 350 127 36.2857143
∑ 350 1 0 100

Situación laboral

36% 33%

31%

Desempleado Inactivo Ocupado

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


Tabla de frecuencias para el rubro edad
Aquí se puede visualizar la tabla de frecuencias para el rubro edad.

En la columna inicial se puede visualizar el factor evaluado, el cual es la categoría de edad.

En la segunda columna se puede visualizar la frecuencia absoluta del factor evaluado de la


primera columna.

En la tercera columna se puede visualizar la frecuencia relativa y para calcularla se utiliza la


siguiente formula:
𝒇𝒊
𝒇𝒓𝒊 =
𝒏
En la cuarta columna se puede visualizar la frecuencia absoluta acumulada que es la suma de
la frecuencia absoluta hasta que da el valor total de la población que es 350

La quinta columna muestra la frecuencia complementaria, que es el valor inverso de la


frecuencia acumulada. En otras palabras, indica la proporción de datos restantes a medida
que se avanza en los intervalos y la cantidad de datos disminuye.

Y por último la sexta columna muestra los porcentajes y para calcularlos se utiliza la siguiente
formula:

%𝒊 = (𝒇𝒓𝒊 )(𝟏𝟎𝟎)

La tabla de frecuencias para el rubro edad inicia en la siguiente pagina

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


Edad f fr F Frecuencia %
complementaria
20 4 0.01142857 4 350 1.14285714
21 12 0.03428571 16 346 3.42857143
22 3 0.00857143 19 334 0.85714286
23 10 0.02857143 29 331 2.85714286
24 9 0.02571429 38 321 2.57142857
25 8 0.02285714 46 312 2.28571429
26 10 0.02857143 56 304 2.85714286
27 9 0.02571429 65 294 2.57142857
28 8 0.02285714 73 285 2.28571429
29 7 0.02 80 277 2
30 5 0.01428571 85 270 1.42857143
31 10 0.02857143 95 265 2.85714286
32 5 0.01428571 100 255 1.42857143
33 4 0.01142857 104 250 1.14285714
34 13 0.03714286 117 246 3.71428571
35 6 0.01714286 123 233 1.71428571
36 10 0.02857143 133 227 2.85714286
37 9 0.02571429 142 217 2.57142857
38 14 0.04 156 208 4
39 3 0.00857143 159 194 0.85714286
40 11 0.03142857 170 191 3.14285714
41 9 0.02571429 179 180 2.57142857
42 5 0.01428571 184 171 1.42857143
43 10 0.02857143 194 166 2.85714286
44 5 0.01428571 199 156 1.42857143
45 17 0.04857143 216 151 4.85714286
46 10 0.02857143 226 134 2.85714286
47 11 0.03142857 237 124 3.14285714
48 7 0.02 244 113 2
49 13 0.03714286 257 106 3.71428571
50 8 0.02285714 265 93 2.28571429
51 7 0.02 272 85 2
52 13 0.03714286 285 78 3.71428571
53 10 0.02857143 295 65 2.85714286
54 4 0.01142857 299 55 1.14285714
55 11 0.03142857 310 51 3.14285714
56 5 0.01428571 315 40 1.42857143
57 13 0.03714286 328 35 3.71428571

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


58 6 0.01714286 334 22 1.71428571
59 9 0.02571429 343 16 2.57142857
60 7 0.02 350 7 2
∑ 350 1 0 100

13
Edades
11
10 6 9 7 4 12 3 10 9 10
5 8 9
13 4
8
7 7
5
8 10
13
5
7 17
9 11
11 6 4
10 9 10 13
5 10 5 3 14

20 21 22 23 24 25 26 27 28 29 30 31 32 33
34 35 36 37 38 39 40 41 42 43 44 45 46 47
48 49 50 51 52 53 54 55 56 57 58 59 60

3. Genera una tabla agrupando valores (realiza 5 grupos de edad) para que
puedas generar a partir de ella un histograma.

Para elaborar esta tabla, es necesario identificar el tipo de tabla que se va a crear, en
este caso es una tabla de frecuencias agrupadas en intervalos. Una vez que se ha
determinado esto, es necesario conocer el número de intervalos que se van a utilizar,
que en este caso es K = 5 según lo indicado en la actividad. Posteriormente, para
calcular el rango se puede utilizar la siguiente fórmula:
𝑹 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏
A sí que sustituimos los datos en esta fórmula: 𝑹 = 𝟔𝟎 − 𝟐𝟎 = 𝟒𝟎
En xmax es 60 ya que es la edad máxima y en xmin es 20 ya que es la edad mínima
Ya una vez que tenemos el rango completado ahora si podemos calcular la amplitud
de nuestros intervalos con la siguiente formula:
𝑹
𝑨=
𝑲
Así que sustituimos datos quedando de la siguiente manera:
𝟒𝟎
𝑨= =𝟖
𝟓

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


Al ya tener nuestra amplitud nuestra tabla quedaría de la siguiente forma:

En la columna inicial se puede visualizar el número de clases.

En la segunda columna se puede visualizar el factor evaluado, el cual es la categoría de edad


en intervalos.

En la tercera columna se puede visualizar la marca de clase que se puede calcular con la
siguiente formula:

𝑳𝒊𝒎𝒊𝒕𝒆 𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓 + 𝑳𝒊𝒎𝒊𝒕𝒆 𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓


𝒙=
𝟐
En la cuarta columna se puede visualizar la frecuencia absoluta del factor evaluado de la
primera columna.

En la quinta columna se puede visualizar la frecuencia absoluta acumulada que es la suma de


la frecuencia absoluta hasta que da el valor total de la población que es 350

En la sexta columna se puede visualizar la frecuencia relativa y para calcularla se utiliza la


siguiente formula:
𝒇𝒊
𝒇𝒓𝒊 =
𝒏

La séptima columna muestra la frecuencia complementaria, que es el valor inverso de la


frecuencia acumulada. En otras palabras, indica la proporción de datos restantes a medida
que se avanza en los intervalos y la cantidad de datos disminuye.

Y por último la octava columna muestra los porcentajes y para calcularlos se utiliza la siguiente
formula:

%𝒊 = (𝒇𝒓𝒊 )(𝟏𝟎𝟎)

Clase Edad X f F fr Frecuencia %


complementaria
1 20-28 24 65 65 0.18571429 350 18.5714286
2 28-36 32 58 123 0.16571429 285 16.5714286
3 36-44 40 71 194 0.20285714 227 20.2857143
4 44-52 48 78 272 0.22285714 156 22.2857143
5 52-60 56 78 350 0.22285714 78 22.2857143

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


∑ 350 1 0 100

Con esto ya se puede crear el histograma y queda de la siguiente manera:

HISTOGRAMA DE EDAD
90
78 78
80 71
70 65
58
60
Frecuencia

50
40
30
20
10
0
24 32 40 48 56
Edad

4. Con base en lo realizado anteriormente contesta las siguientes preguntas:


a. ¿Cuál es el tamaño de la muestra?

En esta situación, la población es finita y consta de 350 encuestados. En consecuencia,


se requiere determinar el tamaño de la muestra mediante un método adecuado para
poblaciones finitas.

𝑵 ∗ 𝒁𝟐𝜶 ∗ 𝒑 ∗ 𝒒
𝒏= 𝟐
𝒆 ∗ (𝑵 − 𝟏) + 𝒁𝟐𝜶 ∗ 𝒑 ∗ 𝒒
n = Tamaño de muestra buscado
N = Tamaño de la población o Universo
Z = Parámetro estadístico que depende el Nivel de confianza (NC)
e = Error de estimación máximo
p = Probabilidad de que ocurra el evento estudiado (éxito)
q = (1-p) = Probabilidad de que no ocurra el evento estudiado
N = 350

Se utiliza Z=1.96 para alcanzar un nivel de confianza del 95% (considerando una
incertidumbre del 5% y sumándola al 95% para obtener el 100% de precisión).
El margen de error, representado por e, es del 5%.

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


Debido a la falta de información previa sobre p y q, se asume que ambos son iguales a
0.5.
Por lo que procedemos a sustituir los datos en la formula:
((350)(1.96)2 (0.5)(0.5))
𝑛= = 183.3924
((0.05)2 (350 − 1)) + ((1.96)2 (0.5)(0.5))
Como se pudo ver en la formula el resultado es de 𝟏𝟖𝟑. 𝟑𝟗𝟐𝟒 por lo tanto ese es el
valor de la muestra.

b. ¿Se aplicó la encuesta a más hombres o mujeres?

Se le aplico la encuesta más a hombres ya que los hombres encuestados fueron un


total de 183 a comparación de las mujeres que fueron de 167
Aquí se puede visualizar en la tabla y el grafico claramente que los hombres fueron
más entrevistados que las mujeres

Sexo f fr F Frecuencia %
complementaria
Varón 183 0.52285714 183 350 52.2857143
Mujer 167 0.47714286 350 183 47.7142857
∑ 350 1 0 100

GRÁFICA DE FRECUENCIA
185 183

180

175
Frecuancias

170
167

165

160

155
1
Varón 2
Mujer
Sexo

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


c. ¿Cuál es el tiempo promedio que los hombres dedican a la lectura? ¿y
las mujeres?

Se realizo esta tabla promediando las horas promedio del día dedicadas por
sexo y actividad en adultos en Excel con la formula siguiente:
PROMEDIO.SI.CONJUNTO que lo que hace es analizar un rango de datos y
encontrar el valor promedio de todos los números que cumplen con un criterio
específico en un conjunto de celdas.

Gracias a esta tabla podemos determinar que el tiempo promedio que los
hombres dedican a la lectura es 01:53:47, mientras que el de las mujeres es de
01:51:27

Horas de TV Horas de lectura Otras actividades


Varón 02:01:58 01:53:47 03:54:07
Mujer 02:08:56 01:51:27 03:49:42
Promedio 02:05:27 01:52:37 03:51:55

Varones

02:01:58
Horas de TV
03:54:07
Horas de lectura
01:53:47
Otras actividades

Mujeres

02:08:56
Horas de TV
03:49:42
Horas de lectura
01:51:27
Otras actividades

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


d. De los encuestados ¿quiénes ven más televisión los hombres o las mujeres
desempleados?

Se realizo una tabla de contingencia diferenciando al sexo, así como su estado


de ocupación de las personas que ven TV, en Excel se ocupó la siguiente formula:
SUMAR.SI.CONJUNTO que te permite sumar el contenido de celdas que cumplen
con varios criterios específicos al mismo tiempo.

Gracias a esta tabla podemos llegar a la conclusión de que las mujeres


desempleadas ven más televisión que los hombres desempleados.

Inactivo Desempleado Ocupado


Varón 109:45:22 120:28:13 141:46:40
Mujer 121:54:17 126:03:28 110:55:25
Totales 231:39:39 246:31:41 252:42:05

¿Quien ve mas tv?

Ocupado 141:46:40 110:55:25


Ocupaciones

Desempleado 120:28:13 126:03:28

Inactivo 109:45:22 121:54:17

0% 20% 40% 60% 80% 100%


Porcentaje

Varón Mujer

e. ¿La edad es relevante para dedicar más tiempo a la lectura?

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


Para esta pregunta retomaremos la tabla hecha en la pregunta dos y generamos
una nueva.
Para generar esta tabla utilizamos en Excel la formula SUMA: Que lo que hace es
sumar los números que se encuentran en las celdas que hayas seleccionado.

Grupo de Horas de
edad lectura
20-28 139:12:16
28-36 102:55:59
36-44 130:08:11
44-52 136:01:22
52-60 148:56:59
Total 657:14:47

Horas de lectura
52-60 148:56:59

44-52 136:01:22
EDADES

36-44 130:08:11

28-36 102:55:59

20-28 139:12:16

0:00:00 24:00:00 48:00:00 72:00:00 96:00:00 120:00:00 144:00:00 168:00:00


HORAS DE LECTURA

En esta tabla y grafica podemos visualizar que las personas destinan distintas
cantidades de tiempo a la lectura en función de su edad. Durante la etapa
universitaria, se observa un aumento significativo en el tiempo dedicado a la lectura,
seguido por un descenso en la década siguiente. En las edades medias y maduras,
se alcanza el pico más alto de horas dedicadas a la lectura. Esto sugiere que la edad
incide directamente en la cantidad de lectura diaria de una persona, ya que las
obligaciones académicas y el tiempo libre son factores importantes que influyen en
el tiempo dedicado a esta actividad.

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


5. Escribe tus conclusiones de acuerdo con el análisis de los datos antes realizado.

Aquí podemos ver la importancia de la estadística y el análisis de datos ya que gracias a


estas dos se pudo obtener la respuesta a estas preguntas por lo que podemos concluir que
la estadística y el análisis de datos son fundamentales para obtener información útil y
significativa sobre un conjunto de datos. A través de técnicas estadísticas, se pueden
identificar patrones, tendencias y relaciones entre las variables, lo que permite describir
de manera detallada las características de la muestra o población. Además, estas dos te
permiten tomar decisiones basadas en evidencia y mejorar la comprensión de los
fenómenos estudiados. En definitiva, el análisis de datos y la estadística es fundamental
para el avance de la investigación en diversas áreas del conocimiento.

6. Recuerda colocar tus referencias y todo el código utilizado en Minitab


para la realización de este proyecto.

1. Alberto, J., Siade, A., Tomás, M., Rubio Pérez, H., Gabriela, M., Montiel, M., Académica,
C., Francisco, M., Mendoza, H., Camargo Martínez, M. A., Jorge, M., Castro, G., Manuel,
L., García, M., Adriana, M., Domínguez, R., Rosaura, M., Serrano Jiménez, G.,
Pedagógica, R., … Chavero, R. (s. f.). DIRECTOR DE LA FCA. Unam.mx. Recuperado 20
de marzo de 2023, de
http://fcasua.contad.unam.mx/apuntes/interiores/docs/20181/administracion/1/LA_1142
_05047_A_Estadistica_Descrptiva_Plan2016.pdf
2. Programas, S. [@SaberProgramas]. (2017, noviembre 20). Excel - Crear histograma y
polígono de frecuencias en Excel. Tutorial en español HD. Youtube.
https://www.youtube.com/watch?v=uZ3Q6Nth7-E

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm


MATERIALES
ARCHIVO HERRAMIENTAS TECNOLÓGICAS

U1_Datos_PIE1.xlsx
Versión de prueba por 30 días: https://www.minitab.com/en-
us/products/minitab/free-trial/

Datos de la tabla recuperados de https://www.ine.es/explica/explica_pasos_pildoras.htm

También podría gustarte