Está en la página 1de 23

Universidad de Sonora

Unidad Regional Centro

División de Ciencias Económicas-Administrativas

Licenciatura en Economía

Estadística I

Edificio 10H – Aula 202

Maestro Tapia Moreno Francisco Javier

Gutierrez Majalca Arnoldo

Proyecto Series de INEGI

Hermosillo, Sonora, México a 14 de Noviembre de 2019


Introducción

El muestreo es una herramienta de la investigación científica, cuya función básica es determinar que parte de una
población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. Se puede realizar
solamente de dos formas: mediante le muestro probabilístico y el no probabilístico. En este documento solo
veremos ejemplos del primero.
En este ejercicio utilizaré los datos de la INEGI sobre las importaciones no petroleras de México en millones de
dólares, con un periodo de tiempo de 1994 a 2019, con un rango de datos de 319 en total, cuales representan una
periodicidad mensual. Se presentarán 3 tablas, la primera presenta un total de 85 datos, extraídos mediante el
método aleatorio simple, y la segunda presenta un total de 150 datos extraídos mediante el método conglomerado,
la tercera mediante el método estratificado, de 100 datos, las explicaciones sobre el procedimiento para su
elaboración se encuentran junto con las tablas.
El objetivo de este trabajo es que el alumno aprenda a usar la herramienta Excel para la selección para el muestreo
estadístico, de forma que se familiarice con los métodos que existen para hacerlo, aprendiendo cuales son los más
convenientes para situaciones determinadas, además de instruirse en el manejo de las herramientas digitales para
el manejo de la información, utilizando gadgets web para realizar el sorteo numérico para realizar la extracción de
los números resultantes.
Sección 1: Distribución de Frecuencias

Tabla 1. Muestreo aleatorio simple:

Se numeraron todos los datos presentados del 1 al 319, eligiéndose de forma totalmente aleatoria 85 de ellos, el
resultado es el siguiente:

4,833.30 10,786.70 16,178.10 23,157.50 24,358.20 29,760.30


5,133.60 9,785.00 18,107.70 25,180.00 29,030.10 32,676.30
5,535.60 8,942.10 15,837.10 23,784.00 29,949.50 32,448.30
5,747.10 11,280.40 17,277.60 20,828.80 27,617.80 30,553.60
5,388.60 13,259.10 18,464.10 17,300.50 26,479.80 33,106.40
6,119.40 12,519.40 18,928.60 15,827.50 30,995.30 31,265.70
6,069.30 13,490.20 17,224.50 17,705.10 29,781.60 37,177.70
5,814.50 14,834.00 16,986.70 17,214.80 30,424.10 33,727.40
6,430.00 13,640.40 20,887.70 19,545.10 30,348.40 39,073.70
6,088.00 14,464.40 20,456.10 20,848.30 30,093.90 31,515.40
6,429.30 13,690.90 19,978.00 17,288.70 27,900.80
6,647.40 11,811.80 21,162.40 22,109.40 30,008.10
6,646.20 13,131.70 25,295.80 23,011.90 29,874.00
7,396.90 12,130.30 24,709.90 23,847.60 31,542.50
9,547.00 15,971.60 23,208.40 25,985.00 30,579.80

TABLA 1. DISTRIBUCIÓN DE FRECUENCIAS DE LAS IMPORTACIONES FOB NO-PETROLERAS EN


MÉXICO 1993-2019 (EN MILES DE PESOS)
Frecuencia Frecuencia
Frecuencia Frecuencia Frecuencia
Limite Frecuencia Frecuencia Frecuencia Frecuencia Acumulada Acumulada
Rango Acumulada Acumulada Acumulada
Real absoluta Relativa Porcentual Acumulada Relativa Porcentual
Relativa Porcentual Inversa
Inversa Inversa
4833.3-
4833.3 9724.79 16 0.188235294 18.82% 0 0 0.00% 85 1 100.00%
9724.79
9724.8-
9724.8 14616.29 12 0.141176471 14.12% 16 0.188235294 18.82% 69 0.811764706 81.18%
14616.29
14616.3-
14616.3 19507.79 15 0.176470588 17.65% 28 0.329411765 32.94% 57 0.670588235 67.06%
19507.79
19507.8-
19507.8 24399.29 14 0.164705882 16.47% 43 0.505882353 50.59% 42 0.494117647 49.41%
24399.29
24399.3-
24399.3 29290.79 8 0.094117647 9.41% 57 0.670588235 67.06% 28 0.329411765 32.94%
29290.79
29290.8-
29290.8 34182.29 18 0.211764706 21.18% 65 0.764705882 76.47% 20 0.235294118 23.53%
34182.29
34182.3-
34182.3 39073.79 2 0.023529412 2.35% 83 0.976470588 97.65% 2 0.023529412 2.35%
39073.79
85 1 100.00% 85 1 100.00% 0 0 0.00%
Tabla 2. Muestreo conglomerado:

Se tomaron los datos según el sexenio gubernamental al que pertenecen, desde Diciembre de 1994 a Diciembre de
2018, siendo cuatro sexenios a tomar en cuenta, cada sexenio cuenta con 72 datos, de los cuales se tomarán 37 de
dos sexenios y 38 de los restantes de manera aleatoria para tener un total 150 datos, el resultado fue el siguiente:
6,746.80 14,400.70 19,767.90 26,351.30 10,786.70 13,652.70 23,011.90 32,988.30
6,029.40 13,056.10 20,456.10 26,056.30 9,785.00 13,131.70 21,775.80 25,861.60
5,393.60 12,519.40 19,978.00 26,566.40 10,525.20 14,091.00 23,472.00 31,154.00
4,757.90 14,225.90 21,162.40 29,949.50 9,713.60 15,034.40 24,833.40 30,579.80
5,154.90 13,382.60 23,271.10 27,095.10 10,828.60 15,292.10 25,922.80 31,396.70
6,191.80 13,162.10 21,635.10 30,016.00 10,840.70 12,130.30 25,245.00 29,760.30
5,873.20 14,834.00 20,988.90 27,617.80 9,639.80 14,900.70 26,367.80 27,412.40
6,216.90 13,061.00 23,208.40 27,409.20 11,689.80 16,705.20 26,775.30 32,676.30
6,225.40 14,464.40 25,180.00 28,972.60 11,914.40 15,342.10 28,232.30 27,998.90
7,240.10 13,863.50 24,705.90 29,744.30 10,818.40 14,239.30 24,358.20 33,601.50
7,342.60 14,006.30 18,792.50 31,031.60 12,301.80 14,808.80 26,110.00 32,448.30
7,450.70 13,664.60 15,547.90 31,418.50 12,402.70 16,689.80 26,860.10 30,553.60
8,744.50 13,505.00 15,282.20 30,995.30 13,397.20 17,275.00 28,929.40 32,085.50
7,622.40 15,021.60 17,300.50 30,067.90 12,602.80 15,837.10 26,623.80 34,887.20
8,723.20 13,872.00 17,214.80 33,557.80 11,280.40 18,811.70 27,494.60 33,201.90
8,302.90 11,936.70 20,045.50 26,635.40 12,860.50 19,637.60 29,050.50 36,308.50
8,826.30 11,811.80 20,848.30 31,080.40 13,259.10 16,986.70 26,082.90 37,177.70
9,547.00 13,148.80 17,288.70 29,949.70 14,015.50 22,976.70 31,422.80 39,073.70
9,503.10 13,157.30 23,250.80 31,867.90 29,030.10 36,089.00

TABLA 2. DISTRIBUCIÓN DE FRECUENCIAS DE LAS IMPORTACIONES FOB NO-PETROLERAS EN


MÉXICO, 1994-2018 (EN MILLONES DE PESOS) POR SEXENIO
Frecuencia Frecuencia
Frecuencia Frecuencia Frecuencia
Limite Frecuencia Frecuencia Frecuencia Frecuencia Acumulada Acumulada
Rango Acumulada Acumulada Acumulada
Real absoluta Relativa Porcentual Acumulada Relativa Porcentual
Relativa Porcentual Inversa
Inversa Inversa
4757.9-
4757.9 9047.38 17 0.113333333 11.33% 0 0 0.00% 150 1 100.00%
9047.38
9047.39-
9047.39 13336.87 28 0.186666667 18.67% 17 0.113333333 11.33% 133 0.886666667 88.67%
13336.87
13336.88-
13336.88 17626.36 31 0.206666667 20.67% 45 0.3 30.00% 105 0.7 70.00%
17626.36
17626.37-
17626.37 21915.85 12 0.08 8.00% 76 0.506666667 50.67% 74 0.493333333 49.33%
21915.85
21915.86-
21915.86 26205.34 16 0.106666667 10.67% 88 0.586666667 58.67% 62 0.413333333 41.33%
26205.34
26205.35-
26205.35 30494.83 24 0.16 16.00% 104 0.693333333 69.33% 46 0.306666667 30.67%
30494.83
30494.84-
30494.84 34784.32 17 0.113333333 11.33% 128 0.853333333 85.33% 22 0.146666667 14.67%
34784.32
34784.33-
34784.33 39073.81 5 0.033333333 3.33% 145 0.966666667 96.67% 5 0.033333333 3.33%
39073.81
150 1 100.00% 150 1 100.00% 0 0 0.00%
Interpretaciones de las tablas:
1. Interpretación de la tercera columna
En ambas tablas podemos observar que los números tienen una variación similar oscilando entre 10 y 20 en la
primera tabla, y entre 10 y 30 en la segunda. Este aumento de la variación de una tabla a otra se debería a el
aumento del tamaño de la muestra de 85 a 150, lo que suele provocar ciertas modificaciones al agregar más valores
en algunas clases. En ambas podemos decir que la mayoría de los datos se encuentran de la mitad hacia abajo,
como un sesgo hacía la izquierda.
2. Interpretación de la cuarta columna
De la misma forma que la columna anterior, podremos apreciar de forma proporcional la distribución de los valores
de la muestra. Ambas tablas comparten valores similares, indicando un sesgo de valores hacia la izquierda, está
tipo de proporción es más correcta dado que se toma al total de valores seleccionados como 1.
3. Interpretación de la quinta columna
Aquí se observa lo mismo que la columna de Frecuencia Relativa, solo que multiplicado por 100, para sí darle el
formato de porcentaje a los números. De igual manera nos indica que la mayoría de los valores se encuentran de
la mitad hacía la izquierda.
4. Interpretación de la octava columna
Esta distribución nos permite observar la linealidad y uniformidad que existe entre los valores de la tabla, podemos
ver que la reducción que existe al pasar de clase a clase es similar, con algunos pequeños picos y fondos, lo cual
indica que el transcurso del tiempo ha llevado al aumento del monto de las importaciones.
5. Interpretación de la novena columna
De manera parecida a la octava columna, aquí existe el manejo en forma proporcional, permitiéndonos estudiar
con más precisión la reducción marginal entre clases según se avanza en la tabla, apoyando mi apunte de que existe
una considerable uniformidad y linealidad en la distribución de los valores.
6. Interpretación de la décima columna
Casi igual que la novena columna, solo que en formato porcentual, el valor total va descendiendo de manera
gradual y medianamente uniforme, esto podrá observarse mejor en la ojiva mayor a menor de la tabla de
distribución según el muestreo por conglumerados.
TABLA 1.1 TABLA DE FRECUENCIA PORCENTUAL DE LAS IMPORTACIONES FOB NO-PETROLERAS
EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS)
Frecuencia
Limite Real
Porcentual
4833.3-9724.79 18.82%
9724.8-14616.29 14.12%
14616.3-19507.79 17.65%
19507.8-24399.29 16.47%
24399.3-29290.79 9.41%
29290.8-34182.29 21.18%
34182.3-39073.79 2.35%

HISTOGRAMA DE LAS IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO, 1994-2018 (EN MILLONES


DE PESOS)

25.00%

20.00%
PORCENTAJE DE IMPORTACIONES

15.00%

10.00%

5.00%

0.00%
4833.3-9724.79 9724.8-14616.29 14616.3- 19507.8- 24399.3- 29290.8- 34182.3-
19507.79 24399.29 29290.79 34182.29 39073.79

MILLONES DE PESOS

Interpretación:
Observando las barras presentadas en la grafica podemos decir que la mayoría de las clases se encuentran entre el
10% y 20%, indicando una cierta igualdad en la distribución de valores de la muestra, con una anomalía en la
ultima clase, provocado por la ausencia de valores tan altos de las importaciones FOB No-Petroleras en México.
De igual forma habré de decir que la clase modal es la de 29290.8-34182.29 con 21.18%, aunque podemos ver
que la mayoría de los datos se encuentra de la mitad hacía la izquierda.
TABLA 2.2 DISTRIBUCIÓN DE FRECUENCIAS DE LA OJIVA MAYOR A MENOR DE LAS
IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS) POR
SEXENIO
Limite Frecuencia
Real Acumulada
Inferior Porcentual Inversa
4757.9 100.00%
9047.39 88.67%
13336.88 70.00%
17626.37 49.33%
21915.86 41.33%
26205.35 30.67%
30494.84 14.67%
34784.33 3.33%
39073.82 0.00%

GRAFICA DE LA OJIVA MAYOR A MENOR DE LAS IMPORTACIONES FOB NO-PETROLERAS EN


MÉXICO, 1994-2018 (EN MILLONES DE PESOS) POR SEXENIO
120%

100%

80%
Porcentaje Acumulado

60%

40%

20%

0%
4757.9 9047.39 13336.88 17626.37 21915.86 26205.35 30494.84 34784.33 39073.82
Millones de Pesos

Interpretación:
La ojiva mayor a menor presenta una línea aproximadamente lineal, aunque evidentemente existen algunos picos
y caídas considerables que se pueden observar, aunque no demerita que la distribución de los datos tenga una
tendencia lineal y medianamente uniforme. Podemos observar que la línea se vuelve más vertical de la mitad hacia
la izquierda, lo que nos indica que los datos están sesgados hacía este lado, diciéndonos que la mayoría de los
montos de importación han sido relativamente bajos.
TABLA 3. TABLA COMPARATIVA DE LAS IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO, 1994-
2018 (EN MILLONES DE PESOS)
F1=
Limite Muestreo F2= Muestreo F3= Muestreo Total
Rango
Real Aleatorio Estratificado Conglomerado
Simple
4443.62-
4,443.62 8,291.41 14 2 13 29
8291.41
8291.42-
8,291.42 12,139.21 7 10 20 37
12139.21
12139.22-
12,139.22 15,987.01 11 38 36 85
15987.01
15987.02-
15,987.02 19,834.81 12 10 11 33
19834.81
19834.82-
19,834.82 23,682.61 10 11 14 35
23682.61
23682.62-
23,682.62 27,530.41 8 5 21 34
27530.41
27530.42-
27,530.42 31,378.21 15 14 19 48
31378.21
31378.22-
31,378.22 35,226.01 6 4 12 22
35226.01
35226.02-
35,226.02 39,073.81 2 6 4 12
39073.81
Totales 85 100 150 335

Interpretación:
La tabla de comparación muestra todos los datos ordenados según el tipo de muestreo a que pertenecen,
permitiendo observar que tanta desviación existe en cada rango según el método utilizado, donde se puede apreciar
que el Muestreo Conglomerado es el que presenta mayor desviación en algunos rangos, debido al procedimiento
utilizado para la selección aleatoria del muestreo. Podemos apreciar también que la mayoría de los datos se
encuentran de la mitad hacia abajo (O hacia arriba según se muestra hacía arriba), lo que nos dice que existe un
sesgo hacía la izquierda en todas las muestras observadas.
TABLA 3.1 DIAGRAMA DE LA TABLA COMPARATIVA DE LAS IMPORTACIONES FOB NO-PETROLERAS
EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS)

40

35

30
Frecuencia Absoluta

25

20

15

10

0
4443.62-8291.41 8291.42-12139.21 12139.22-15987.01 15987.02-19834.81 19834.82-23682.61 23682.62-27530.41 27530.42-31378.21 31378.22-35226.01 35226.02-39073.81

Miles de Pesos

Muestreo Aleatorio Simple Muestreo Estratificado Muestreo Conglomerado

Interpretación:
Aquí se puede visualizar de manera gráfica que tanta distancia existe entre cada uno de los métodos de muestreo,
considerando como una situación perfecta cuando todas las barras cuentan con la misma altura, cosa no es posible
en la práctica, y mientras más distancia exista entre cada una, mayor es la desviación que existen entre las muestras.
Como se puede observar en la Tabla 3.1, las frecuencias absolutas de cada una indican que la proporción de los
rangos es considerablemente similar.
Sección 2: Medidas centrales y de Dispersión

a) Medidas centrales.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto
de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de
tendencia central más utilizadas son: media, mediana y moda. En esta ocasión también agregaremos el rango, los
cuartiles y deciles, para obtener una mejor apreciación del muestreo elaborado.

TABLA 1. MEDIDAS CENTRALES DE LAS IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO, 1994-


2018 (EN MILLONES DE PESOS)
Estadístico Valor Interpretación
Esto nos indica la cantidad de unidades existente entre el valor mínimo y el máximo,
Rango 34240.5
en este caso es de 34240.5
Media Esta es una cantidad de equilibrio representativa entre la cantidad de todas las
19619.3
Aritmética muestras, que es 19619.3
Este valor indica donde los datos hacia a la derecha y a la izquierda son iguales en
Mediana 18464.1 cantidad, esto nos dice que hasta 18464.1 están la mitad de los datos y después de
este valor están la otra mitad.
Este es el valor con más repeticiones en una población o muestra, en este caso es
Moda 9547
9547
Cuartiles Nos indican la distribución de los datos en 4 partes iguales.
0 4757.9 Indica el valor mínimo de toda la muestra, el punto de comienzo.
1 12402.7 El valor indica que el 25% de los datos son menores de 12402.7
Este cuartil es el mismo valor que la mediana aritmética, donde me dice que el 50%
2 18,464.1
de datos son menores de 18,464.1
Indica que el 75% de los datos están por debajo de 27494.6, es decir que 3 cuartos de
3 27494.6
toda la muestra es menor a ese número.
4 39073.7 Este es el valor máximo de toda la muestra.
Deciles Los deciles dividen la muestra en 10 partes iguales.
1 7342.6 El 10% de los valores de la muestra son inferiores a este número.
2 11280.4 El 20% de los valores de la muestra son inferiores a este número.
3 13397.2 El 30% de los valores de la muestra son inferiores a este número.
4 15282.2 El 40% de los valores de la muestra son inferiores a este número.
El 50% de los datos son menores a este dato, también es el mismo valor que la
5 18464.1
mediana aritmética.
6 23011.9 El 60% de los valores de la muestra son inferiores a este número.
7 26110 El 70% de los valores de la muestra son inferiores a este número.
8 29744.3 El 80% de los valores de la muestra son inferiores a este número.
9 31396.7 El 90% de los valores de la muestra son inferiores a este número.
10 39073.7 El resto de los valores son inferiores a este. Es el valor máximo.
Percentiles Me indica la posición de un dato, dependiendo el tamaño de la muestra.
25 12402.7 El 25% de los valores de la muestra son inferiores a este número.
95 33106.4 El 95% de los valores de la muestra son inferiores a este número.
Podemos observar una mayor dispersión de los valores de la muestra desde la mitad hacia la derecha,
Información
teniendo en cuenta que existe una concentración de datos de la mitad a la izquierda, es decir, un sesgo
adicional
a la siniestra.

Puedo concluir que los datos de las importaciones FOB están centrados en los estándares 19619.3 y 18464.1 de
millones de pesos (media y Mediana), los cuales nos indican el centro del área de los datos y el centro de la cantidad
de datos dispersos en la muestra. El valor en sí indica que la mayoría de los montos de importación se han
mantenido moderados.
1.1 Diagrama de caja
Este es un gráfico que nos muestra la distribución de los cuartiles de la muestra, donde podemos ver e interpretar
la distribución de los datos tomados en esta muestra.

TABLA 2. DIAGRAMA DE CAJA DE LAS IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO, 1994-2018


(EN MILLONES DE PESOS)

0 5000 10000 15000 20000 25000 30000 35000 40000 45000

Interpretación del diagrama de caja


La caja nos muestra que existe una considerable inclinación de los datos hacia la izquierda, es decir, los datos
menores, también los bigotes de la misma indican que fuera de los valores centrales existe una serie número de
valores mayores a esta, y un poco menos de valores menores, lo cual nos dice que la distribución de la muestra
es extendida y no está totalmente concentrada como si fuere una campana de Gauss.
2. Medidas de dispersión.
Las medidas de dispersión muestran la variabilidad de una distribución, indicándolo por medio de un valor en
unidades, si los diferentes valores de la medida de cada una de las variables están muy alejados de la media
aritmética. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más cercana será a la
media.
TABLA 3. MEDIDAS DE DISPERSIÓN DE LAS IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO,
1994-2018 (EN MILLONES DE PESOS)
Estadístico Valor Interpretación
Esto nos indica la separación
existente entre el valor mínimo y el
Rango 34240.5
máximo, en este caso es de
34240.5
15091.9 nos indica la diferencia
entre el tercer cuartil y el primero
Rango intercuartil 15091.9 dentro de nuestro muestreo, entre
estos datos deben encontrarse las
medidas de tendencia central.
En este caso nos muestra que los
datos están muy distanciados entre
Varianza 79802196.1 sí mismos, pues es encuentran
considerablemente separados del
promedio.
Es similar a la varianza, pues los
datos donde están los niveles de las
Desviación estándar 8933.2
importaciones FOB están muy
dispersas entre sí.
Podemos comparar la variabilidad
Coeficiente de variación 45.53 de las importaciones entre sí, en
este caso 45.53
Los datos de las importaciones son bastante
Información
dispersos entre sí, indicando una extensión grande
adicional
de la muestra.

Estas medidas de dispersión nos hablan, en grandes rasgos, que las importaciones FOB No-Petroleas en México
desde 1994 a 2018 son bastante dispersas, probablemente han ido en considerable aumento con el transcurso de
los años. Nos indican que la extensión cuantitativa de los datos es bastante grande, y aunado a lo observado
anteriormente podemos inducir que se debe al aumento gradual de los montos de importaciones en México en el
transcurso de los años.
3. Medidas de forma.
Las medidas de forma son aquellas que nos muestran si una distribución de frecuencia tiene características
especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en
un tipo particular de distribución.
TABLA 4. MEDIDAS DE FORMA DE LA DISTRIBUCIÓN DE VALORES DE LAS IMPORTACIONES FOB
NO-PETROLERAS EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS)
Estadístico Valor Interpretación

Coeficiente de
El valor indica que los datos están más dispersos al lado derecho después de la media, es
asimetría 0.39
decir también con un sesgo hacía la izquierda.
de Pearson
Coeficiente de
asimetría Este valor nos indica lo mismo que el anterior, pero una medida algo menor, datos más
0.19
de Yule dispersos de la mitad a la derecha, y más concentrados hacia la izquierda.
Browley
Coeficiente de
asimetría 0.21 Siendo un valor positivo, señala que la dispersión después de la media, es más dispersa.
de Fisher
Coeficiente de La fórmula de Excel termina entregando un valor similar a los coeficientes anteriores,
asimetría 0.13 aunque siendo el menos sesgado hacia la izquierda, podríamos decir que es el más
de Excel recomendable en muestras tan grandes como esta.
Coeficiente de La curtosis negativa señala que la mayoría de los datos están sesgados a la izquierda y al ser
curtosis -1.05 una curtosis de tipo platicúrtica, significa que los datos están moderadamente dispersos, sin
de Fisher un pico pronunciado.
Coeficiente de
Este caso es muy similar al anterior y señala que con su curtosis negativa que la mayoría de
curtosis -1.14
los datos uniformemente distribuidos.
de Excel

Sí se pensara en toda la muestra como una gráfica de polígono, sería fácil señalar que el pico de la misma se
hallaría a la izquierda de la misma, con una distribución moderadamente uniforme a través de todo el rango de
datos, aunque no exceptúa la posibilidad de alguna anomalía en la parte derecha de la tabla, sin llegar a opacar lo
dominancia de los valores menores dentro de nuestra selección muestral.
4. Comparación de las medidas centrales de datos no agrupados con los agrupados

En este apartado haremos una comparación de las medidas centrales de las muestras seleccionadas, por un lado,
utilizando el método de datos no agrupados y por el otro el de datos agrupados. Nuestra intención es hallar que
tanta diferencia existe entre estos dos tipos de organización de los valores obtenidos, así como el de hallar las
medidas centrales de todas las muestras en conjunto.
TABLA 5. TABLA COMPARATIVA DE LAS MEDIDAS CENTRALES DE LAS IMPORTACIONES FOB NO-
PETROLERAS EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS)
Datos Datos
Estadístico
No agrupados agrupados
Rango 34240.5 34240.5
Media 19125.8 19289.4
Aritmética
Mediana 18107.7 17616.1
Moda 9547 10754.3
Cuartiles
0 4833.3 4833.3
1 11934.1 10004.4
2 18031.2 17583.2
3 26780.8 26413.4
4 39073.7 39073.7
Deciles
4 14873.1 14118.9
8 28448.8212 26695.14176
Percentiles
25 11934.1 10004.4
95 34765.1 35017.2
Los datos agrupados fueron
Información
organizados en 8 clases en total
adicional
para el calculo de los resultados

Como se observa en los resultados obtenidos en la tabla podemos decir a grandes rasgos que nuestra distribución
de valores es bastante extensa, con una variabilidad considerablemente uniforme, lo cual nos indica una cierta
linealidad en el aumento gradual del monto de las importaciones. También cabe señalar que el promedio obtenido
representa un punto moderado tomando en cuenta la dependencia provocada por la importación de bienes.
4.1 Comparación de los diagramas de caja de datos agrupados con no agrupados
A continuación, se presentarán dos diagramas de caja para los datos agrupados y los no agrupados, con el fin de
observar las diferencias que existen entre ellas, también el de visualizar la extensión de la distribución de los
valores de la muestra total, así como la ubicación aproximada de sus medidas centrales.
TABLA 6. DIAGRAMA DE CAJA DE LAS IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO, 1994-2018
(EN MILLONES DE PESOS) (DATOS AGRUPADOS)

0 5000 10000 15000 20000 25000 30000 35000 40000 45000

TABLA 7. DIAGRAMA DE CAJA DE LAS IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO, 1994-2018


(EN MILLONES DE PESOS) (DATOS NO AGRUPADOS)

0 5000 10000 15000 20000 25000 30000 35000 40000 45000

Las gráficas obtenidas nos muestran diferencias mínimas entre los diagramas de caja, casi imperceptibles a primera
vista, por lo que sería conveniente afirma que la diferencia entre los datos agrupados y no agrupados es mínima,
por no decir nula. Las graficas en sí nos dicen que existe un sesgo a la izquierda en la distribución de los valores
de las importaciones, y datos más distribuidos y lejanos hacia la derecha.
4.2 Comparación de las medidas de dispersión de datos agrupado y no agrupados.
En esta tabla veremos una comparación de las medidas de dispersión obtenidos según el método de datos no
agrupados y datos agrupados, nuestra intención, al igual que la tabla anterior, es el de conocer que tanta diferencia
existe entre un método y otro, así como el de observar cómo los valores de la muestra total mantienen cierta
distancia cuantitativa entre sí para conocer más a detalle la extensión de la misma.
TABLA 8. TABLA COMPARATIVA DE LAS MEDIDAS DE DISPERSIÓN DE LAS IMPORTACIONES FOB
NO-PETROLERAS EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS)
Datos Datos
Estadístico
No agrupados agrupados
Rango 34239.4 34241.4
Rango
14846.7 16409
intercuartil
Varianza 87743689.2 86341281.4
Desviación
9366.1 9291.9
estándar
Coeficiente de
49.1 47.9
variación
Información Los datos agrupados fueron
adicional organizados en 8 clases en total
Observando los resultados obtenidos podemos decir que los datos tienen una extensión bastante importante, desde
los más pequeños a los más grandes, de forma que inducimos que esto se debe al aumento de los montos de las
importaciones en México a través de los años, aunado a la gradualidad y uniformidad observada en la tabla pasada.

4.3. Comparación de las medidas de forma de datos agrupados con no agrupados


En esta tabla haremos una comparación entra las medidas de forma de los datos agrupados y los no agrupados,
con el fin de observar la diferencia que existe entre los resultados de uno y otro, así como el de conocer la
inclinación o sesgo de los datos, y de conocer si los valores se amontonan en un punto para generar uno o varios
o picos, o sí los datos son más uniformes y por tanto no existen esos picos representando una distribución plana.
TABLA 9. TABLA COMPARATIVA DE LAS MEDIDAS DE FORMA DE LAS IMPORTACIONES FOB NO-
PETROLERAS EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS)

Datos Datos
Estadístico
No agrupados agrupados
Coeficiente de asimetría 0.36 0.49
de Pearson
Coeficiente de asimetría
0.18 0.21
de Yule Browley
Coeficiente de asimetría
0.23 0.16
de Fisher
Coeficiente de asimetría
0.14 0.12
de Excel
Coeficiente de curtosis
-1.1 -1.92
de Fisher
Coeficiente de curtosis
-1.09 -1.21
de Excel
Los coeficientes obtenidos tienen una variación mínima respecto a los datos agrupados y no agrupados,
posiblemente debido a la forma de calcular para uno y otro, pero en términos generales, ambos métodos nos indican
que existe un sesgo de valores hacía la izquierda (O hacia valores menores) de la distribución, así como una
uniformidad en la presentación de los datos, sin picos pronunciados por la acumulación de valores en cierta clase
o cercanía a alguna medida central.
Sección 3: Distribuciones de Probabilidad Discreta

1. Distribución de Probabilidad Binomial.


a) La probabilidad de que en los próximos tres meses (noviembre, diciembre de 2019 y enero
de 2020) la cantidad asignada caiga en la cuarta clase o cuarto intervalo.
TABLA 1. FRECUENCIA RELATIVA DE LAS IMPORTACIONES FOB NO-PETROLERAS EN
MÉXICO (EN MILLONES DE PESOS)
Rango Frecuencia Relativa
4833.3 9724.79 0.18823529
9724.8 14616.29 0.14117647
14616.3 19507.79 0.17647059
19507.8 24399.29 0.16470588
24399.3 29290.79 0.09411765
29290.8 34182.29 0.21176471
34182.3 39073.79 0.02352941
1

La probabilidad dada es de 0.004468146 que también puede presentarse como 0.4468146%. Esto se calculo
tomando en cuenta la probabilidad de 0.16470588 correspondiente al cuarto intervalo que va desde el 19507.8 al
24399.29, a modo de que los 3 meses a pronosticar cayeran dentro de este rango. El resultado obtenido nos indica
que hay una probabilidad bastante baja de que este hecho ocurra dado que los datos de la distribución están muy
dispersos y no se concentran en algún intervalo especifico.
b) La probabilidad de que en los próximos dos meses (noviembre, diciembre de 2019) la
cantidad esté entre el tercer y quinto intervalo.
La probabilidad obtenida para este caso es de 0.189480969 que también puede presentarse como 18.9480969%.
El calculo se hizo tomando en cuenta que la suma de probabilidades de los intervalos del tercero al cuarto da un
total de 0.435294118. Por tanto, podemos decir que la probabilidad de que en los próximos dos meses el monto
de importaciones caiga dentro de 14616.3 a 29290.79 a primera vista baja, pero tomando en cuenta la dispersión
de la distribución podemos darnos cuenta que es una medianamente alta.

2. Distribución de Probabilidad de Poisson.


a) La probabilidad de que, en un lapso de tiempo de 3 meses, se generen 2 asignaciones
mayores de 20 millones de pesos.
La probabilidad obtenida para esta incógnita es de 0.459821562 que también puede presentarse como
45.9821562%. Esto se hizo tomando en cuenta que los intervalos hacia la izquierda, (O hacia arriba como se
presenta en la tabla), tiene en conjunto una probabilidad más alta de ocurrencia, mientras que números más altos
tienen una probabilidad más baja (Con excepción del sexto intervalo), con lo que en conjunto con la media obtenida
se llegó a esa proporción. Esto nos indica que en los próximos 3 meses es considerablemente probable que se
obtenga en dos de ellos montos mayores a 20 millones de pesos.
b) La probabilidad de que, en un lapso de tiempo de 6 meses, se generen no más de 3
asignaciones menores de 12 millones de pesos.
La probabilidad resultante para este caso es de 0.8956241523, que también puede presentarse como
89.56241523%. El resultado se obtuvo a manera que el monto esperado a superar es bastante bajo como vemos en
la tabla, y es bastante fácil pronosticar que la probabilidad de que los montos sean así de bajos es muy poco
probable, por lo cual podemos estar seguros de que en los próximos 6 menes no se generaran más de 2 asignaciones
menos de 12 millones de pesos.
3. Distribución de Probabilidad Hipergeométrica
a) La probabilidad de que al seleccionar una muestra de 80 datos (o 100, o 125 o 150, el tamaño
de muestra que te haya tocado) se encuentren 10 datos con cantidades menores que el tercer
intervalo.
La probabilidad obtenida para este caso es de 0.058454987, que puede también presentarse como 5.8454987%.
Esto se calculo tomando en cuenta a todos los números menores a 14616.3, usando la muestra 80 datos,
considerando los 321 datos del total de registro de INEGI. Este resultado nos indica que la probabilidad de que en
cualquier muestra que hagamos con ese tamaño la probabilidad de obtener específicamente 10 datos menores a
14616.3 es baja, considerando la gran dispersión de la población.
b) La probabilidad de que al seleccionar una muestra de 80 datos (o 100, o 125 o 150, el tamaño
de muestra que te haya tocado) se encuentren por lo menos 5 datos con cantidades mayores
que 20 millones de pesos.
La probabilidad calculada para este caso es de 0.875945185, que puede también presentarse como 87.5945185%.
Esto se calculó tomando en cuenta a todos los números mayores a 20 millones, usando una muestra de 150 datos,
y el total del registro de la INEGI. Este numero nos muestra que la probabilidad de obtener 5 o más datos mayores
a 20 millones en nuestra muestra es bastante probable, ya que el valor en cuestión es algo bajo según vemos en la
tabla de distribuciones, lo que indica un gran numero de datos a elegir mayores a este.
Sección 4: Modelos de Pronostico
1. Sección individual
Modelo de Medías Móviles
TABLA 1. TABLA COMPARATIVA PARA EL MODELO DE MEDIAS MOVILES
Ecuación Medias Móviles Orden 6
Coeficiente de Correlación 0.61972577
Enero 1.02407857
Febrero 1.00650258
Marzo 0.9832688
Abril 0.98227617
Mayo 0.96515056
Junio 0.96962788
Índice de Estacionalidad
Julio 0.97599676
Agosto 0.9936768
Septiembre 1.01768552
Octubre 1.01725175
Noviembre 1.03498684
Diciembre 1.03258935

Los datos en conjunto muestran que el modelo de medias móviles es uno que nos brinda valores considerablemente
cercanos a los datos reales, su coeficiente de correlación, aunque nos pueda parecer algo bajo en comparación con
otros tipos de pronostico se encuentra por encima en su precisión. Los índices estacionales nos muestran como los
datos van subiendo y bajando a medida que pasan los meses, en este caso las subidas ocurren desde Junio a
Noviembre y bajan de Diciembre a Mayo, danto un patrón de ciclicidad, estacionalidad y tendencia.

Modelo de Suavizamiento Exponencial


TABLA 2. TABLA COMPARATIVA PARA EL MODELO DE SUAVIZAMIENTO EXPONENCIAL (ALFA=0.3)
Ecuación Suavizamiento Exponencial con Alfa=0.3
Coeficiente de Correlación 0.692408951
Enero 1.01183834
Febrero 0.98206572
Marzo 0.95964408
Abril 0.97380111
Mayo 0.976604
Junio 0.99441406
Índice de Estacionalidad
Julio 1.000453
Agosto 1.00580349
Septiembre 1.01831625
Octubre 1.01379266
Noviembre 1.03792907
Diciembre 1.03126245

Los datos en conjunto para este caso nos muestran que el modelo de suavizamiento exponencial es el más preciso
para llegar los pronósticos correctos, dado que su coeficiente de correlación (como veremos más adelante) es el
más alto de todos los modelos de pronóstico. Observe como los índices de estacionalidad nos muestran que las
alzas y subidas suelen darse en ciertos meses de manera repetida, comenzando su ascenso en Abril y comenzando
el descenso en Enero, esto resulta en un patrón de ciclicidad, estacionalidad y tendencia.
2. Sección en Equipo

TABLA 3. TABLA COMPARATIVA DE LOS DIFERENTES TIPOS DE PRONOSTICO UTILIZANDO LOS


DATOS DE ENERO DEL 2013 HASTA SEPTIEMBRE DEL 2019 SOBRE LA SERIE DE INEGI
IMPORTACIONES FOB NO-PETROLERAS
Modelo de Pronostico Coeficiente de Correlación
Lineal 0.61772123
Cuadrático 0.59612546
Medías Móviles 0.61972577
Suavizamiento Especial 0.692408951

Como queda demostrado por el Coeficiente de Correlación, el equipo llegó a la conclusión que el modelo de tipo
Suavizamiento Especial es el más preciso para la serie de INEGI Importaciones FOB No-Petroleras.

TABLA 4. TABLA DE LA SERIE INEGI IMPORTACIONES FOB NO-PETROLERAS DEL AÑO 2019,
INCLUYENDO LOS DATOS PRONOSTICADOS (EN MILLONES DE PESOS) (MODELO SUAVIZAMIENTO)
Año Importaciones
2019/01 33131.877
2019/02 31515.367
2019/03 33483.007
2019/04 33743.575
2019/05 36228.465
2019/06 31558.555
2019/07 36331.617
2019/08 35821.387
2019/09 33823.1
2019/10 34361.5233
2019/11 34369.4944
2019/12 33976.8127
TABLA 4. GRAFICA DE LA SERIE INEGI IMPORTACIONES FOB NO-PETROLERAS DESDE ENERO DE
2013 HASTA DICIEMBRE DE 2019, INCLUYENDO LOS DATOS PRONOSTICADOS (EN MILLONES DE
PESOS) (MODELO SUAVIZAMIENTO)
Conclusión

La estadística puede ser tanto bien como la utilizada para todos los ámbitos, ningún área del conocimiento se ve
exenta a los posibles abusos que la disciplina puede sufrir a conveniencia de los intereses de grupo o individuos,
podemos terminar este trabajo diciendo que cada día la información falsa se vuelva más y más grande, y nos es
más difícil para nosotros estudiantes, y para las personas comunes, el poder discernir entre la verdad y la mentira,
por ello hay que analizar detenidamente la información aportada y revisar las fuentes pertinentes, y rechazar a
cualquiera que no cuente con ellas.
En otro punto, el buen uso de la estadística nos enseña el camino a seguir en la utilización de esta disciplina,
sirviéndonos de guía para la elaboración de proyectos propios, pero también es de gran ayuda en la vida del
oficinista promedio, alentándolo a usar formulas y ecuaciones pertinentes para hacer su labor de la manera más
eficiente posible, dentro del ámbito estudiantil resulta más útil ya que el saber usar estadística es esencial para la
elaboración y defensa de una tesis.
Para dar por finalizado este trabajo, podemos resumir que, aunque el mal uso de la estadística se halla acrecentado
en los últimos tiempos, no hay que darnos por vencidos contra este mal, ya que lo bueno que le podemos sacar es
aún mayor que la suma de todos sus males, y es nuestro deber informar a los demás sobre las deficiencias de las
noticias y artículos que leen todos los días.
Referencias

Instituto Nacional de Estadística y Geografía. (2019, 1 julio). Banco de Información Económica (BIE).
Recuperado 3 septiembre, 2019, de https://www.inegi.org.mx/Sistemas/BIE/Default.aspx?Topic=0
https://pinetools.com/es/generador-numeros-aleatorios
Anderson, D. and Sweeney, D. (2011). Estadística para negocios y economía (11a. ed.). 11th ed. Distrito Federal:
CENGAGE Learning.

También podría gustarte