Está en la página 1de 24

Contenido

INTRODUCCIÓN..................................................................................................................................3
METODOLOGÍA..................................................................................................................................4
BASE DE DATOS Y REFERENCIA..........................................................................................................8
TABLAS DE FRECUENCIA POR TRIMESTRE SEGÚN LA BASE DE DATOS SELECTA................................9
INTERPRETACIÓN DE LA INFORMACIÓN..........................................................................................23
INTRODUCCIÓN

En mis dos evidencias de entrega de las unidades anteriores a esta tercera y


última unidad, seleccioné como tema “El desempleo en México”, el cual ha sido,
con el paso de los años, un tema sumamente importante y a su vez preocupante,
debido a las grandes cifras que se han presentado con respecto a la población
mexicana que no se encuentra activa económicamente, impactando así desde
jóvenes de 15 años hasta adultos mayores de 60 años.

Para este tema se aplicaron procesos estadísticos como la elaboración de tablas


de frecuencias y los campos que la conforman, así como una interpretación escrita
y explicada de los datos obtenidos para convertirlos finalmente en información
para lectores finales, destacando así su mejor manejo y facilidad en la
comprensión como tal de lo estipulado en las tablas de frecuencias y gráficos.

En el presente documento de entrega de evidencia se dará a conocer nuevamente


la información trabajada en las dos evidencias de entrega anteriores, información
que fue recabada desde el año 2017 hasta el primer trimestre del presente año
2019 acerca del desempleo, por intervalos de edades, que vive la sociedad
mexicana, empleando así tablas de frecuencias, histogramas, ojivas y
conclusiones del mismo tema.
METODOLOGÍA

1.- Elección de tema y planeación de actividad: con relación al módulo cursado


y con base en una problemática que presenta la sociedad actual, se realizó la
elección del tema a investigar, en este caso, el “desempleo en México”,
problemática donde se puede hacer uso de la estadística para generar
información. Posterior a su elección, se realizó una tabla de frecuencias para
datos agrupados (agrupación en clases o intervalos de clase cuando el número
de observaciones es muy grande), lo cual conllevó a realizar el cálculo de la clase,
rango, intervalos, amplitud, frecuencia, frecuencia acumulada, frecuencia
relativa, distribución de porcentajes, distribución de porcentajes
acumulados y marca de clases.

La información fue tomada del portal de INEGI, donde he de mencionar que


actualmente la liga de donde fue consultada ya no se encuentra disponible, esto
debido a la actualización continua de información por ser una página dedicada al
muestreo, recolección y presentación de información actual. De igual manera no
es visible el número de observaciones, esto ya que por ser una cantidad muy
considerable de datos (millones) no podría ser visualizado de manera correcta y
completa al consultar la información por internet.

He de mencionar que decidí elaborar una tabla de frecuencia por cada trimestre
de cada año mostrado en la base datos (siete tablas de frecuencia en total,
comenzando por el tercer trimestre del año 2017 y finalizando en el primer
trimestre del año 2019), no sólo por el objetivo de practicar, sino para
exponer y tener una mejor consulta de los datos para una mejor
comprensión de la información.

Se toma como población de estudio a la sociedad mexicana que no se encuentra


económicamente activa, yendo desde la edad de 15 años hasta 60+ y como ya se
mencionó con anterioridad empezando desde el tercer trimestre del año 2017
hasta el primer trimestre del año 2019.

Finalmente se representa la información por medio de un histograma y una ojiva


por cada tabla de frecuencia, indicando con los datos de población la distribución
en cada uno de los intervalos que conforman a la tabla de frecuencias, para
posteriormente ser interpretada de forma descriptiva y en texto.

Como último punto de la actividad en general, se describen los resultados más


significativos a partir de la interpretación brindada, esto para resaltar los
porcentajes / áreas que tuvieron un mayor impacto.
2.- Cálculo y elaboración de la tabla de frecuencias:

 Clase: agrupación de los valores en intervalos que contengan la misma


amplitud (Ditutor, 2015). Las clases nos permiten determinar el número de
intervalos que conforman a la tabla de frecuencia para datos agrupados.
Una vez que calculé los intervalos, procedí a realizar el conteo, lo que me
permitió determinar el número total de clases para la tabla de frecuencias.

 Rango: conjunto de valores comprendidos entre otros dos números dados,


conocidos estos últimos como límites del intervalo. Para el caso de la base
de datos que se tomó a consideración desde la evidencia de entrega de la
unidad 1, el rango es comprendido por el límite inferior con valor de 15 y
como límite superior 60+, lo cual, al momento de hacer la resta de 60 – 15
nos da como resultado = 45.

 Intervalos: es la expresión que se utiliza para nombrar a un intervalo. Tiene


un límite superior Ls y un límite inferior Li. Considero que por ser una
cantidad basta de información se optó por definir los intervalos de forma
directa contemplando los números de observaciones, en este caso desde la
edad de 15 años hasta los 60+

 Amplitud: es la diferencia del límite superior menos el límite inferior (Ls –


Li) De igual manera que en el caso de los intervalos, considero que (como
la base de datos de INEGI ya se encontraba realizada) se decidió presentar
la amplitud de valores de 5 en 5 comenzando por el límite inferior hasta
alcanzar el límite superior.

 Frecuencia: es el número de veces que se repite un dato, también se le


conoce como frecuencia absoluta. Por la ausencia del número de
observaciones podemos visualizar que la frecuencia ya está otorgada por
INEGI, ya que en la base de datos nos aparece ya calculado el dato de la
frecuencia (los datos que más se repiten en el intervalo establecido).

 Frecuencia acumulada: es la suma de las frecuencias absolutas de las


variables hasta el renglón. También es conocida como frecuencia
absoluta acumulada. La manera en la que fui calculando la frecuencia
acumulada fue, como se menciona en la definición de la misma, ir sumando
cada valor de la frecuencia hasta el final del renglón.

 Frecuencia relativa: es el resultado de dividir la frecuencia entre el número


total de datos. Este dato también puede verse como un porcentaje. Como
se menciona en la definición de la frecuencia relativa, fui dividiendo cada
valor del campo de frecuencia sobre el total década uno de los trimestres
por año, por ejemplo, en la tabla de frecuencia del primer trimestre de 2019,
procedí a dividir el valor de 8,167,319 entre el total de 38,218,968
obteniendo como resultado 0.21
 Distribución de porcentajes: es el cálculo tal cual del porcentaje de la
frecuencia relativa. Para ello se multiplica el dato de la frecuencia relativa
por el número 100 (lo que representa el 100% de la información en
general).
Tomando como dato el resultado del ejemplo del cálculo de la frecuencia
relativa, el valor de 0.21 * 100 = 21% Obtenidos todos y cada uno de los
valores de la frecuencia relativa, procedí a multiplicarlos por 100 obteniendo
así el porcentaje final a utilizar para la elaboración de la gráfica circular / de
pastel.

 Distribución de porcentajes acumulados: es la suma de los porcentajes


hasta el renglón. La manera en la que fui calculando la distribución de
porcentajes acumulados fue como se menciona en la definición de la
misma, ir sumando cada valor de la distribución de porcentajes hasta el
final del renglón, obteniendo así el 100% de los datos.

 Marca de clase: Es el punto medio del intervalo y es el resultado de la


suma de los límites inferior y superior del intervalo dividido entre 2. A la
marca de clase también se le denomina punto medio de clase. Realicé,
por separado, la suma del límite inferior y el límite superior de cada
intervalo de cada tabla de frecuencia para dividirlo sobre 2, de esta forma
pude obtener la marca de clase para cada caso.

 Varianza: mide la mayor o menor dispersión de los valores de la variable


respecto a la media aritmética. Siempre es mayor o igual que cero y menor
que infinito. Se define como la media de los cuadrados de las diferencias
del valor de los datos menos la media aritmética de éstos.

 Variación estándar: muestra qué tan alejado está un dato del valor de la
media aritmética, es decir, la diferencia que hay entre un dato y la media
aritmética. Se define como la raíz cuadrada positiva de la varianza.
3.- Gráfica de los datos: una vez obtenidos los porcentajes, procedí a insertar un
gráfico por medio del procesador de textos para cada una de las tablas de
frecuencia calculadas.

4.- Descripción de los datos más significativos: analizando toda la información


ya planteada, y teniendo un mayor enfoque en aquellos datos que son mucho
mayores a comparación del resto, en contexto con la problemática de la cual se
obtuvo la información fue como pude realizar la descripción de los datos que se
consideran como más significativos, por el auge (en este caso del desempleo de
México) que llega a poseer en el intervalo selecto.
BASE DE DATOS Y REFERENCIA

INEGI. (2019). INEGI. Obtenido de INEGI:


https://www.inegi.org.mx/sistemas/olap/consulta/general_ver4/MDXQueryDatos_Colore
s.asp?proy=enoe_pe_ed15_pnea
TABLAS DE FRECUENCIA POR TRIMESTRE SEGÚN LA
BASE DE DATOS SELECTA
PRIMER TRIMESTRE DE 2019
DISTRIBUCIÓN
DISTRIBUCIÓN MARCA
INTERVALO DE FRECUENCIA FRECUENCIA DE
CLASE FRECUENCIA DE DE
CLASE ACUMULADA RELATIVA PORCENTAJES
PORCENTAJES CLASES
ACUMULADOS
1 15 a 19 años 8,167,319 8,167,319 0.21 21.37% 21.37% 17
2 20 a 29 años 6,679,353 14,846,672 0.17 17.48% 38.85% 24.5
3 30 a 39 años 4,199,626 19,046,298 0.11 10.99% 49.83% 34.5
4 40 a 49 años 4,159,645 23,205,943 0.11 10.88% 60.72% 44.5
5 50 a 59 años 4,374,080 27,580,023 0.11 11.44% 72.16% 54.5
6 + 60 años y más 10,600,979 38,181,002 0.28 27.74% 99.90% -
7 No especificado 37,966 38,218,968 0.00 0.10% 100.00% -
TOTA
  38,218,968   1.00 100.00%    
L

Varianza = 638,235,716,203,360.2857166667

Se utilizará la fórmula de la varianza para el caso de una muestra, la cual es la


siguiente:

Primero, habrá que hacer el cálculo del promedio/media. Para ello, sumamos los
elementos del campo/variable frecuencia: 8,167,319 + 6,679,353 + 4,199,626 +
4,159,645 + 4,374,080 + 10,600,979 + 37,966 = 38,218,968

Después, el total de la sumatoria (38,218,968) se divide entre el número de


observaciones de la muestra (7): 38,218,968/7 = 5,459,852.57

El resultado final es 5,459,852.57

Después, a cada valor del campo de frecuencia le restamos el promedio obtenido


y elevamos el resultado al cuadrado:

S2 = ∑ (8,167,319 - 5,459,852.57)2 + (6,679,353 - 5,459,852.57)2 + (4,199,626 -


5,459,852.57)2 + (4,159,645 - 5,459,852.57)2 + (4,374,080 - 5,459,852.57)2 +
(10,600,979 - 5,459,852.57)2 + (37,966 - 5,459,852.57)2
7-1 = 6  total de datos del campo clase
S2 = 3,829,414,297,220,161.7143
6

S2 = 638,235,716,203,360.2857166667

Desviación estándar = 25,263,327.4966572898

Para la desviación estándar, como su descripción lo dice, es la raíz cuadrada


positiva de la varianza.

Calculamos raíz cuadrada de la varianza:

S = √638,235,716,203,360.2857166667

S = 25,263,327.4966572898

PRIMER TRIMESTRE DE 2019


12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
1

15 a 19 años 20 a 29 años 30 a 39 años 40 a 49 años


50 a 59 años + 60 años y más No especificado

PRIMER TRIMESTRE DE 2019


12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
os os os os os ás do
añ añ añ añ añ m ca
19 29 39 49 59 sy ic fi
a a a a a ño pe
15 20 30 40 50 a es
60 No
+
CUARTO TRIMESTRE DE 2018
DISTRIBUCIÓN
DISTRIBUCIÓN MARCA
INTERVALO DE FRECUENCIA FRECUENCIA DE
CLASE FRECUENCIA DE DE
CLASE ACUMULADA RELATIVA PORCENTAJES
PORCENTAJES CLASES
ACUMULADOS
1 15 a 19 años 7,911,057 7,911,057 0.21 20.92% 20.92% 17
2 20 a 29 años 6,728,630 14,639,687 0.18 17.79% 38.71% 24.5
3 30 a 39 años 4,290,646 18,930,333 0.11 11.34% 50.05% 34.5
4 40 a 49 años 4,066,345 22,996,678 0.11 10.75% 60.80% 44.5
5 50 a 59 años 4,385,656 27,382,334 0.12 11.60% 72.40% 54.5
6 + 60 años y más 10,401,704 37,784,038 0.28 27.50% 99.90% -
7 No especificado 38,619 37,822,657 0.00 0.10% 100.00% -
TOTA
  37,822,657   1.00 100.00%    
L

Varianza = 248,551,675,713,781.2381166667

Se utilizará la fórmula de la varianza para el caso de una muestra, la cual es la


siguiente:

Primero, habrá que hacer el cálculo del promedio. Para ello, sumamos los
elementos del campo/variable frecuencia: 7,911,057 + 6,728,630 + 4,290,646 +
4,066,345 + 4,385,656 + 10,401,704 + 38,619 = 37,822,657

Después, el total de la sumatoria (37,822,657) se divide entre el número de


observaciones de la muestra (7): 37,822,657/7 = 5,403,236.71

El resultado final es 5,403,236.71

Después, a cada valor del campo de frecuencia le restamos el promedio obtenido


y elevamos el resultado al cuadrado:

S2 = ∑ (7,911,057 - 5,403,236.71)2 + (6,728,630 - 5,403,236.71)2 + (4,290,646 -


5,403,236.71)2 + (4,066,345 - 5,403,236.71)2 + (4,385,656 - 5,403,236.71)2 +
(10,401,704 - 5,403,236.71)2 + (38,619 - 5,403,236.71)2
7-1 = 6  total de datos del campo clase

S2 = 1,491,310,054,282,687.4287
6
S2 = 248,551,675,713,781.2381166667
Desviación estándar = 15,765,521,7393456801

Para la desviación estándar, como su descripción lo dice, es la raíz cuadrada


positiva de la varianza.

Calculamos raíz cuadrada de la varianza:

S = √248,551,675,713,781.2381166667

S = 15,765,521,7393456801

CUARTO TRIMESTRE DE 2018


12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
1

15 a 19 años 20 a 29 años 30 a 39 años 40 a 49 años


50 a 59 años + 60 años y más No especificado

CUARTO TRIMESTRE DE 2018


12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
os os os os os ás do
añ añ añ añ añ ym ca
19 29 39 49 59 ic fi
a a a a a os pe
15 20 30 40 50 añ es
60 No
+
TERCER TRIMESTRE DE 2018
DISTRIBUCIÓN
DISTRIBUCIÓN MARCA
INTERVALO DE FRECUENCIA FRECUENCIA DE
CLASE FRECUENCIA DE DE
CLASE ACUMULADA RELATIVA PORCENTAJES
PORCENTAJES CLASES
ACUMULADOS
1 15 a 19 años 7,878,414 7,878,414 0.21 20.96% 20.96% 17
2 20 a 29 años 6,719,235 14,597,649 0.18 17.88% 38.84% 24.5
3 30 a 39 años 4,235,514 18,833,163 0.11 11.27% 50.11% 34.5
4 40 a 49 años 4,152,934 22,986,097 0.11 11.05% 61.16% 44.5
5 50 a 59 años 4,335,683 27,321,780 0.12 11.54% 72.69% 54.5
6 + 60 años y más 10,223,410 37,545,190 0.27 27.20% 99.89% -
7 No especificado 40,291 37,585,481 0.00 0.11% 100.00% -
TOTA
  37,585,481   1.00 100.00%    
L

Varianza = 10,405,399,291,027.3165666667

Se utilizará la fórmula de la varianza para el caso de una muestra, la cual es la


siguiente:

Primero, habrá que hacer el cálculo del promedio. Para ello, sumamos los
elementos del campo/variable frecuencia: 7,878,414 + 6,719,235 + 4,235,514 +
4,152,934 + 4,335,683 + 10,223,410 + 40,291 = 37,585,481

Después, el total de la sumatoria (37,585,481) se divide entre el número de


observaciones de la muestra (7): 37,585,481/7 = 5,369,354.43

El resultado final es 5,369,354.43

Después, a cada valor del campo de frecuencia le restamos el promedio obtenido


y elevamos el resultado al cuadrado:

S2 = ∑ (7,878,414 - 5,369,354.43)2 + (6,719,235 - 5,369,354.43)2 + (4,235,514 -


5,369,354.43)2 + (4,152,934 - 5,369,354.43)2 + (4,335,683 - 5,369,354.43)2 +
(10,223,410 - 5,369,354.43)2 + (40,291 - 5,369,354.43)2
7-1 = 6  total de datos del campo clase

S2 = 62,432,399,526,163,8994
6
S2 = 10,405,399,291,027.3165666667

Desviación estándar = 3,225,740,2128856125

Para la desviación estándar, como su descripción lo dice, es la raíz cuadrada


positiva de la varianza.

Calculamos raíz cuadrada de la varianza:

S = √10,405,399,291,027.3165666667

S = 3,225,740,2128856125

TERCER TRIMESTRE DE 2018


12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
1

15 a 19 años 20 a 29 años 30 a 39 años 40 a 49 años


50 a 59 años + 60 años y más No especificado
TERCER TRIMESTRE DE 2018
12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
os os os os os ás do
añ añ añ añ añ m ca
19 29 39 49 59 osy ecifi
a a a a a añ p
15 20 30 40 50 es
60 No
+

SEGUNDO TRIMESTRE DE 2018


DISTRIBUCIÓN
DISTRIBUCIÓN MARCA
INTERVALO DE FRECUENCIA FRECUENCIA DE
CLASE FRECUENCIA DE DE
CLASE ACUMULADA RELATIVA PORCENTAJES
PORCENTAJES CLASES
ACUMULADOS
1 15 a 19 años 8,068,495 8,068,495 0.22 21.56% 21.56% 17
2 20 a 29 años 6,743,927 14,812,422 0.18 18.02% 39.58% 24.5
3 30 a 39 años 4,227,536 19,039,958 0.11 11.30% 50.88% 34.5
4 40 a 49 años 4,118,663 23,158,621 0.11 11.01% 61.88% 44.5
5 50 a 59 años 4,326,799 27,485,420 0.12 11.56% 73.44% 54.5
6 + 60 años y más 9,907,604 37,393,024 0.26 26.47% 99.92% -
7 No especificado 31,299 37,424,323 0.00 0.08% 100.00% -
TOTA
  37,424,323   1.00 100.00%    
L

Varianza = 10,118,228,729,241.7162666667

Se utilizará la fórmula de la varianza para el caso de una muestra, la cual es la


siguiente:

Primero, habrá que hacer el cálculo del promedio. Para ello, sumamos los
elementos del campo/variable frecuencia: 8,068,495 + 6,743,927 + 4,227,536 +
4,118,663 + 4,326,799 + 9,907,604 + 31,299 = 37,424,323
Después, el total de la sumatoria (37,424,323) se divide entre el número de
observaciones de la muestra (7): 37,424,323/7 = 5,346,331.86

El resultado final es 5,346,331.86

Después, a cada valor del campo de frecuencia le restamos el promedio obtenido


y elevamos el resultado al cuadrado:

S2 = ∑ (8,068,495 - 5,346,331.86)2 + (6,743,927 - 5,346,331.86)2 + (4,227,536 -


5,346,331.86)2 + (4,118,663 - 5,346,331.86)2 + (4,326,799 - 5,346,331.86)2 +
(9,907,604 - 5,346,331.86)2 + (31,299 - 5,346,331.86)2
7-1 = 6  total de datos del campo clase

S2 = 60,709,372,375,450.2976
6

S2 = 10,118,228,729,241.7162666667

Desviación estándar = 3,180,916.3348383931

Para la desviación estándar, como su descripción lo dice, es la raíz cuadrada


positiva de la varianza.

Calculamos raíz cuadrada de la varianza:

S = √10,118,228,729,241.7162666667

S = 3,180,916.3348383931

SEGUNDO TRIMESTRE DE 2018


12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
1

15 a 19 años 20 a 29 años 30 a 39 años 40 a 49 años


50 a 59 años + 60 años y más No especificado
SEGUNDO TRIMESTRE DE 2018
12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
os os os os os ás do
añ añ añ añ añ ym ca
19 29 39 49 59 os ecifi
a a a a a añ p
15 20 30 40 50 es
60 No
+

PRIMER TRIMESTRE DE 2018


DISTRIBUCIÓN
DISTRIBUCIÓN MARCA
INTERVALO DE FRECUENCIA FRECUENCIA DE
CLASE FRECUENCIA DE DE
CLASE ACUMULADA RELATIVA PORCENTAJES
PORCENTAJES CLASES
ACUMULADOS
1 15 a 19 años 8,218,007 8,218,007 0.22 21.62% 21.62% 17
2 20 a 29 años 6,880,316 15,098,323 0.18 18.10% 39.72% 24.5
3 30 a 39 años 4,305,037 19,403,360 0.11 11.32% 51.04% 34.5
4 40 a 49 años 4,178,023 23,581,383 0.11 10.99% 62.03% 44.5
5 50 a 59 años 4,361,508 27,942,891 0.11 11.47% 73.51% 54.5
6 + 60 años y más 10,035,362 37,978,253 0.26 26.40% 99.91% -
7 No especificado 35,779 38,014,032 0.00 0.09% 100.00% -
TOTA
  38,014,032   1.00 100.00%    
L

Varianza = 10,693,006,645,220

Se utilizará la fórmula de la varianza para el caso de una muestra, la cual es la


siguiente:

Primero, habrá que hacer el cálculo del promedio. Para ello, sumamos los
elementos del campo/variable frecuencia: 8,218,007 + 6,880,316+ 4,305,037+
4,178,023 + 4,361,508 + 10,035,362 + 35,779 = 38,014,032
Después, el total de la sumatoria (38,014,032) se divide entre el número de
observaciones de la muestra (7): 38,014,032/7 = 5,430,576.00

El resultado final es 5,430,576.00

Después, a cada valor del campo de frecuencia le restamos el promedio obtenido


y elevamos el resultado al cuadrado:

S2 = ∑ (8,218,007 - 5,430,576.00)2 + (6,880,316 - 5,430,576.00)2 + (4,305,037 -


5,430,576.00)2 + (4,178,023 - 5,430,576.00)2 + (4,361,508 - 5,430,576.00)2 +
(10,035,362 - 5,430,576.00)2 + (35,779 - 5,430,576.00)2
7-1 = 6  total de datos del campo clase

S2 = 64,158,039,871,320
6

S2 = 10,693,006,645,220

Desviación estándar = 3,270,016.3065679046

Para la desviación estándar, como su descripción lo dice, es la raíz cuadrada


positiva de la varianza.

Calculamos raíz cuadrada de la varianza:

S = √10,693,006,645,2203.868

S = 3,270,016.3065679046

PRIMER TRIMESTRE DE 2018


12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
1

15 a 19 años 20 a 29 años 30 a 39 años 40 a 49 años


50 a 59 años + 60 años y más No especificado
PRIMER TRIMESTRE DE 2018
12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
os os os os os ás do
añ añ añ añ añ ym ca
19 29 39 49 59 os ecifi
a a a a a añ p
15 20 30 40 50 es
60 No
+

CUARTO TRIMESTRE DE 2017


DISTRIBUCIÓN
DISTRIBUCIÓN MARCA
INTERVALO DE FRECUENCIA FRECUENCIA DE
CLASE FRECUENCIA DE DE
CLASE ACUMULADA RELATIVA PORCENTAJES
PORCENTAJES CLASES
ACUMULADOS
1 15 a 19 años 7,890,711 7,890,711 0.21 21.13% 21.13% 17
2 20 a 29 años 6,735,365 14,626,076 0.18 18.03% 39.16% 24.5
3 30 a 39 años 4,209,591 18,835,667 0.11 11.27% 50.43% 34.5
4 40 a 49 años 4,200,668 23,036,335 0.11 11.25% 61.68% 44.5
5 50 a 59 años 4,285,123 27,321,458 0.11 11.47% 73.16% 54.5
6 + 60 años y más 9,989,227 37,310,685 0.27 26.75% 99.90% -
7 No especificado 36,599 37,347,284 0.00 0.10% 100.00% -
TOTA
  37,347,284   1.00 100.00%    
L

Varianza = 10,313,913,724,376.1047833333

Se utilizará la fórmula de la varianza para el caso de una muestra, la cual es la


siguiente:

Primero, habrá que hacer el cálculo del promedio. Para ello, sumamos los
elementos del campo/variable frecuencia: 7,890,711 + 6,735,365 + 4,209,591 +
4,200,668 + 4,285,123 + 9,989,227 + 36,599 = 37,347,284
Después, el total de la sumatoria (37,347,284) se divide entre el número de
observaciones de la muestra (7): 37,347,284/7 = 5,335,326.29

El resultado final es 5,335,326.29

Después, a cada valor del campo de frecuencia le restamos el promedio obtenido


y elevamos el resultado al cuadrado:

S2 = ∑ (7,890,711 - 5,335,326.29)2 + (6,735,365 - 5,335,326.29)2 + (4,209,591 -


5,335,326.29)2 + (4,200,668 - 5,335,326.29)2 + (4,285,123 - 5,335,326.29)2 +
(9,989,227 - 5,335,326.29)2 + (36,599 - 5,335,326.29)2
7-1 = 6  total de datos del campo clase

S2 = 61,883,482,346,256.6287
6

S2 = 10,313,913,724,376.1047833333

Desviación estándar = 3,211,528.2537097669

Para la desviación estándar, como su descripción lo dice, es la raíz cuadrada


positiva de la varianza.

Calculamos raíz cuadrada de la varianza:

S = √10,313,913,724,376.1047833333

S = 3,211,528.2537097669

CUARTO TRIMESTRE DE 2017


12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
1

15 a 19 años 20 a 29 años 30 a 39 años 40 a 49 años


50 a 59 años + 60 años y más No especificado
CUARTO TRIMESTRE DE 2017
12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
os os os os os ás do
añ añ añ añ añ m ca
19 29 39 49 59 osy ecifi
a a a a a añ p
15 20 30 40 50 es
60 No
+

TERCER TRIMESTRE DE 2017


DISTRIBUCIÓN
DISTRIBUCIÓN MARCA
INTERVALO DE FRECUENCIA FRECUENCIA DE
CLASE FRECUENCIA DE DE
CLASE ACUMULADA RELATIVA PORCENTAJES
PORCENTAJES CLASES
ACUMULADOS
1 15 a 19 años 8,002,083 8,002,083 0.22 21.54% 21.54% 17
2 20 a 29 años 6,612,257 14,614,340 0.18 17.80% 39.35% 24.5
3 30 a 39 años 4,279,501 18,893,841 0.12 11.52% 50.87% 34.5
4 40 a 49 años 4,198,614 23,092,455 0.11 11.30% 62.17% 44.5
5 50 a 59 años 4,282,125 27,374,580 0.12 11.53% 73.70% 54.5
6 + 60 años y más 9,738,226 37,112,806 0.26 26.22% 99.92% -
7 No especificado 29,841 37,142,647 0.00 0.08% 100.00% -
TOTA
  37,142,647   1.00 100.00%    
L

Varianza = 9,964,329,704,277.9649

Se utilizará la fórmula de la varianza para el caso de una muestra, la cual es la


siguiente:
Primero, habrá que hacer el cálculo del promedio. Para ello, sumamos los
elementos del campo/variable frecuencia: 8,002,083 + 6,612,257 + 4,279,501 +
4,198,614 + 4,282,125 + 9,738,226 + 29,841= 37,142,647

Después, el total de la sumatoria (37,142,647) se divide entre el número de


observaciones de la muestra (7): 37,142,647/7 = 5,306,092.43

El resultado final es 5,306,092.43

Después, a cada valor del campo de frecuencia le restamos el promedio obtenido


y elevamos el resultado al cuadrado:

S2 = ∑ (8,002,083 - 5,306,092.43)2 + (6,612,257 - 5,306,092.43)2 + (4,279,501 -


5,306,092.43)2 + (4,198,614 - 5,306,092.43)2 + (4,282,125)2 + (9,738,226 -
5,306,092.43)2 + (29,841 - 5,306,092.43)2
7-1 = 6  total de datos del campo clase

S2 = 59,785,978,225,667.7894
6

S2 = 9,964,329,704,277.9649

Desviación estándar = 3,156,632.6527294817

Para la desviación estándar, como su descripción lo dice, es la raíz cuadrada


positiva de la varianza.

Calculamos raíz cuadrada de la varianza:

S = √9,964,329,704,277.9649

S = 3,156,632.6527294817
TERCER TRIMESTRE DE 2017
12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
1

15 a 19 años 20 a 29 años 30 a 39 años 40 a 49 años


50 a 59 años + 60 años y más No especificado

TERCER TRIMESTRE DE 2017


12,000,000

10,000,000

8,000,000

6,000,000

4,000,000

2,000,000

0
os os os os os ás do
añ añ añ añ añ ym ca
19 29 39 49 59 os ecifi
a a a a a añ p
15 20 30 40 50 es
60 No
+

INTERPRETACIÓN DE LA INFORMACIÓN

Al igual que las dos evidencias de entrega de las unidades anteriores, se calculó
de la misma forma la información de todas y cada una de las tablas de frecuencia
presentadas en esta evidencia de entrega, así como la elaboración de un
histograma y una ojiva en cada una de las tablas de frecuencia, siendo de fácil
comprensión y visualización para el espectador. Estas herramientas de la
estadística nos permiten no sólo organizar, sino también analizar más a detalle los
datos obtenidos. En cada uno de los casos podemos observar la gran diferencia
que van teniendo cada uno de los datos tanto en su tabla de frecuencias como al
momento de ser presentada en un gráfico.
Los datos agrupados contienen muchos más elementos a contemplar en una tabla
de frecuencia, y por ello es necesario saber calcular los valores a emplear. Se nos
presenta el mismo tema de desempleo en México, desde la edad de los 15 años
hasta 60 en adelante desde el tercer trimestre del año 2017 hasta el primer
trimestre del año 2019.
En primer lugar el campo de clase nos permite conocer la agrupación de los
valores en cada uno de los intervalos. Cada clase tiene asignada su frecuencia
correspondiente. En cada uno de los casos fue el mismo número de clases
empleadas (siete).
El intervalo de clase es el rango utilizado para la división de los valores
numéricos con los que se hará la operación con grandes cantidades de datos, por
lo mismo que no podemos tener en una tabla demasiada información, es por ello
que necesita ser agrupado. Como en el caso anterior, para todas las tablas de
frecuencia se utilizaron los mismos intervalos, ya que como tal ya se encontraban
propuestos por parte de INEGI al momento de consultar la información. Para el
caso anterior, es necesario conocer la amplitud que tendrá el intervalo, así como
el número de intervalos que se manejarán en la tabla de frecuencia. En el primer
intervalo de todas las tablas de frecuencia podemos notar que la amplitud es de 5,
mientras que en el resto de los intervalos es de 10, esto con la finalidad de tener
una mejor y mayor agrupación del resto de los datos a calcular. Definidos los
intervalos junto con la amplitud que tendrá cada uno de ellos, se procede a
obtener la frecuencia, misma que en estos casos ya nos fue proporcionada por
INEGI. Tomando la población de estudio (población mexicana desde los 15 hasta
los 60 años de edad en adelante) es visible que son millones de personas a
quienes se les aplicó una encuesta para fines estadísticos. Se opta por presentar
la información en histogramas y ojivas por medio de los datos en los campos de
frecuencia de cada tabla. Para el caso de la distribución de porcentajes se
multiplica en valor del campo de la frecuencia relativa por 100, que en sí es el
100% de todos los datos en general, de esta forma es más comprensible la
cantidad de datos de los intervalos al ser expuestos en porcentaje, nos da a una
idea de cómo sería sobre todo si se interpreta la información de manera gráfica.
Todo lo anterior nos facilita en gran parte el cómo, podemos ver los incrementos y
decrementos que se han ido presentando a lo largo de los años desde 2017 hasta
inicios de 2019, teniendo gran impacto en algunos casos/intervalos de edades.
Las gráficas en sí facilitan mucho la interpretación de la información, haciendo
mucho más notorios los espacios en donde se tiene mayor impacto en cuanto a
desempleo si se critica desde un punto de vista analítico.
En referencia a las gráficas, el intervalo de clase de 15 a 19 años es el que llega a
mantenerse en un rango de los 7,500,000.00 de habitantes hasta los 8,200,000.00
en las siete exposiciones presentadas.
El intervalo de 30 a 39 años es el que se mantiene, en cuestión de porcentajes y
en promedio en un 50.8% no puede verse demasiada alteración y cambio en la
información si se hace un comparativo en general de las siete gráficas y tablas de
frecuencia.
El intervalo de 60 años en adelante también sufre del mismo tipo de alteraciones
que el rango de 15 a 19 años de edad, puesto a que está entre los 9, 000,000.00
y 10, 000,000.00 de habitantes que no se encuentran económicamente activos, no
hay un cambio sumamente significativo sino que por el contrario logra mantenerse
entre esos dos rangos.
El resto de los rangos se mantienen en sus unidades de millar cambiando sólo
unidades de miles, manteniéndose prácticamente estables con el paso del tiempo
en que se obtuvo la información para cada trimestre.

También podría gustarte