Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Licenciatura en Economía
Estadística I
El muestreo es una herramienta de la investigación científica, cuya función básica es determinar que parte de una
población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. Se puede realizar
solamente de dos formas: mediante le muestro probabilístico y el no probabilístico. En este documento solo
veremos ejemplos del primero.
En este ejercicio utilizaré los datos de la INEGI sobre las importaciones no petroleras de México en millones de
dólares, con un periodo de tiempo de 1994 a 2019, con un rango de datos de 319 en total, cuales representan una
periodicidad mensual. Se presentarán 3 tablas, la primera presenta un total de 85 datos, extraídos mediante el
método aleatorio simple, y la segunda presenta un total de 150 datos extraídos mediante el método conglomerado,
la tercera mediante el método estratificado, de 100 datos, las explicaciones sobre el procedimiento para su
elaboración se encuentran junto con las tablas.
El objetivo de este trabajo es que el alumno aprenda a usar la herramienta Excel para la selección para el muestreo
estadístico, de forma que se familiarice con los métodos que existen para hacerlo, aprendiendo cuales son los más
convenientes para situaciones determinadas, además de instruirse en el manejo de las herramientas digitales para
el manejo de la información, utilizando gadgets web para realizar el sorteo numérico para realizar la extracción de
los números resultantes.
Sección 1: Distribución de Frecuencias
Se numeraron todos los datos presentados del 1 al 319, eligiéndose de forma totalmente aleatoria 85 de ellos, el
resultado es el siguiente:
Se tomaron los datos según el sexenio gubernamental al que pertenecen, desde Diciembre de 1994 a Diciembre de
2018, siendo cuatro sexenios a tomar en cuenta, cada sexenio cuenta con 72 datos, de los cuales se tomarán 37 de
dos sexenios y 38 de los restantes de manera aleatoria para tener un total 150 datos, el resultado fue el siguiente:
6,746.80 14,400.70 19,767.90 26,351.30 10,786.70 13,652.70 23,011.90 32,988.30
6,029.40 13,056.10 20,456.10 26,056.30 9,785.00 13,131.70 21,775.80 25,861.60
5,393.60 12,519.40 19,978.00 26,566.40 10,525.20 14,091.00 23,472.00 31,154.00
4,757.90 14,225.90 21,162.40 29,949.50 9,713.60 15,034.40 24,833.40 30,579.80
5,154.90 13,382.60 23,271.10 27,095.10 10,828.60 15,292.10 25,922.80 31,396.70
6,191.80 13,162.10 21,635.10 30,016.00 10,840.70 12,130.30 25,245.00 29,760.30
5,873.20 14,834.00 20,988.90 27,617.80 9,639.80 14,900.70 26,367.80 27,412.40
6,216.90 13,061.00 23,208.40 27,409.20 11,689.80 16,705.20 26,775.30 32,676.30
6,225.40 14,464.40 25,180.00 28,972.60 11,914.40 15,342.10 28,232.30 27,998.90
7,240.10 13,863.50 24,705.90 29,744.30 10,818.40 14,239.30 24,358.20 33,601.50
7,342.60 14,006.30 18,792.50 31,031.60 12,301.80 14,808.80 26,110.00 32,448.30
7,450.70 13,664.60 15,547.90 31,418.50 12,402.70 16,689.80 26,860.10 30,553.60
8,744.50 13,505.00 15,282.20 30,995.30 13,397.20 17,275.00 28,929.40 32,085.50
7,622.40 15,021.60 17,300.50 30,067.90 12,602.80 15,837.10 26,623.80 34,887.20
8,723.20 13,872.00 17,214.80 33,557.80 11,280.40 18,811.70 27,494.60 33,201.90
8,302.90 11,936.70 20,045.50 26,635.40 12,860.50 19,637.60 29,050.50 36,308.50
8,826.30 11,811.80 20,848.30 31,080.40 13,259.10 16,986.70 26,082.90 37,177.70
9,547.00 13,148.80 17,288.70 29,949.70 14,015.50 22,976.70 31,422.80 39,073.70
9,503.10 13,157.30 23,250.80 31,867.90 29,030.10 36,089.00
25.00%
20.00%
PORCENTAJE DE IMPORTACIONES
15.00%
10.00%
5.00%
0.00%
4833.3-9724.79 9724.8-14616.29 14616.3- 19507.8- 24399.3- 29290.8- 34182.3-
19507.79 24399.29 29290.79 34182.29 39073.79
MILLONES DE PESOS
Interpretación:
Observando las barras presentadas en la grafica podemos decir que la mayoría de las clases se encuentran entre el
10% y 20%, indicando una cierta igualdad en la distribución de valores de la muestra, con una anomalía en la
ultima clase, provocado por la ausencia de valores tan altos de las importaciones FOB No-Petroleras en México.
De igual forma habré de decir que la clase modal es la de 29290.8-34182.29 con 21.18%, aunque podemos ver
que la mayoría de los datos se encuentra de la mitad hacía la izquierda.
TABLA 2.2 DISTRIBUCIÓN DE FRECUENCIAS DE LA OJIVA MAYOR A MENOR DE LAS
IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS) POR
SEXENIO
Limite Frecuencia
Real Acumulada
Inferior Porcentual Inversa
4757.9 100.00%
9047.39 88.67%
13336.88 70.00%
17626.37 49.33%
21915.86 41.33%
26205.35 30.67%
30494.84 14.67%
34784.33 3.33%
39073.82 0.00%
100%
80%
Porcentaje Acumulado
60%
40%
20%
0%
4757.9 9047.39 13336.88 17626.37 21915.86 26205.35 30494.84 34784.33 39073.82
Millones de Pesos
Interpretación:
La ojiva mayor a menor presenta una línea aproximadamente lineal, aunque evidentemente existen algunos picos
y caídas considerables que se pueden observar, aunque no demerita que la distribución de los datos tenga una
tendencia lineal y medianamente uniforme. Podemos observar que la línea se vuelve más vertical de la mitad hacia
la izquierda, lo que nos indica que los datos están sesgados hacía este lado, diciéndonos que la mayoría de los
montos de importación han sido relativamente bajos.
TABLA 3. TABLA COMPARATIVA DE LAS IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO, 1994-
2018 (EN MILLONES DE PESOS)
F1=
Limite Muestreo F2= Muestreo F3= Muestreo Total
Rango
Real Aleatorio Estratificado Conglomerado
Simple
4443.62-
4,443.62 8,291.41 14 2 13 29
8291.41
8291.42-
8,291.42 12,139.21 7 10 20 37
12139.21
12139.22-
12,139.22 15,987.01 11 38 36 85
15987.01
15987.02-
15,987.02 19,834.81 12 10 11 33
19834.81
19834.82-
19,834.82 23,682.61 10 11 14 35
23682.61
23682.62-
23,682.62 27,530.41 8 5 21 34
27530.41
27530.42-
27,530.42 31,378.21 15 14 19 48
31378.21
31378.22-
31,378.22 35,226.01 6 4 12 22
35226.01
35226.02-
35,226.02 39,073.81 2 6 4 12
39073.81
Totales 85 100 150 335
Interpretación:
La tabla de comparación muestra todos los datos ordenados según el tipo de muestreo a que pertenecen,
permitiendo observar que tanta desviación existe en cada rango según el método utilizado, donde se puede apreciar
que el Muestreo Conglomerado es el que presenta mayor desviación en algunos rangos, debido al procedimiento
utilizado para la selección aleatoria del muestreo. Podemos apreciar también que la mayoría de los datos se
encuentran de la mitad hacia abajo (O hacia arriba según se muestra hacía arriba), lo que nos dice que existe un
sesgo hacía la izquierda en todas las muestras observadas.
TABLA 3.1 DIAGRAMA DE LA TABLA COMPARATIVA DE LAS IMPORTACIONES FOB NO-PETROLERAS
EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS)
40
35
30
Frecuencia Absoluta
25
20
15
10
0
4443.62-8291.41 8291.42-12139.21 12139.22-15987.01 15987.02-19834.81 19834.82-23682.61 23682.62-27530.41 27530.42-31378.21 31378.22-35226.01 35226.02-39073.81
Miles de Pesos
Interpretación:
Aquí se puede visualizar de manera gráfica que tanta distancia existe entre cada uno de los métodos de muestreo,
considerando como una situación perfecta cuando todas las barras cuentan con la misma altura, cosa no es posible
en la práctica, y mientras más distancia exista entre cada una, mayor es la desviación que existen entre las muestras.
Como se puede observar en la Tabla 3.1, las frecuencias absolutas de cada una indican que la proporción de los
rangos es considerablemente similar.
Sección 2: Medidas centrales y de Dispersión
a) Medidas centrales.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto
de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de
tendencia central más utilizadas son: media, mediana y moda. En esta ocasión también agregaremos el rango, los
cuartiles y deciles, para obtener una mejor apreciación del muestreo elaborado.
Puedo concluir que los datos de las importaciones FOB están centrados en los estándares 19619.3 y 18464.1 de
millones de pesos (media y Mediana), los cuales nos indican el centro del área de los datos y el centro de la cantidad
de datos dispersos en la muestra. El valor en sí indica que la mayoría de los montos de importación se han
mantenido moderados.
1.1 Diagrama de caja
Este es un gráfico que nos muestra la distribución de los cuartiles de la muestra, donde podemos ver e interpretar
la distribución de los datos tomados en esta muestra.
Estas medidas de dispersión nos hablan, en grandes rasgos, que las importaciones FOB No-Petroleas en México
desde 1994 a 2018 son bastante dispersas, probablemente han ido en considerable aumento con el transcurso de
los años. Nos indican que la extensión cuantitativa de los datos es bastante grande, y aunado a lo observado
anteriormente podemos inducir que se debe al aumento gradual de los montos de importaciones en México en el
transcurso de los años.
3. Medidas de forma.
Las medidas de forma son aquellas que nos muestran si una distribución de frecuencia tiene características
especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en
un tipo particular de distribución.
TABLA 4. MEDIDAS DE FORMA DE LA DISTRIBUCIÓN DE VALORES DE LAS IMPORTACIONES FOB
NO-PETROLERAS EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS)
Estadístico Valor Interpretación
Coeficiente de
El valor indica que los datos están más dispersos al lado derecho después de la media, es
asimetría 0.39
decir también con un sesgo hacía la izquierda.
de Pearson
Coeficiente de
asimetría Este valor nos indica lo mismo que el anterior, pero una medida algo menor, datos más
0.19
de Yule dispersos de la mitad a la derecha, y más concentrados hacia la izquierda.
Browley
Coeficiente de
asimetría 0.21 Siendo un valor positivo, señala que la dispersión después de la media, es más dispersa.
de Fisher
Coeficiente de La fórmula de Excel termina entregando un valor similar a los coeficientes anteriores,
asimetría 0.13 aunque siendo el menos sesgado hacia la izquierda, podríamos decir que es el más
de Excel recomendable en muestras tan grandes como esta.
Coeficiente de La curtosis negativa señala que la mayoría de los datos están sesgados a la izquierda y al ser
curtosis -1.05 una curtosis de tipo platicúrtica, significa que los datos están moderadamente dispersos, sin
de Fisher un pico pronunciado.
Coeficiente de
Este caso es muy similar al anterior y señala que con su curtosis negativa que la mayoría de
curtosis -1.14
los datos uniformemente distribuidos.
de Excel
Sí se pensara en toda la muestra como una gráfica de polígono, sería fácil señalar que el pico de la misma se
hallaría a la izquierda de la misma, con una distribución moderadamente uniforme a través de todo el rango de
datos, aunque no exceptúa la posibilidad de alguna anomalía en la parte derecha de la tabla, sin llegar a opacar lo
dominancia de los valores menores dentro de nuestra selección muestral.
4. Comparación de las medidas centrales de datos no agrupados con los agrupados
En este apartado haremos una comparación de las medidas centrales de las muestras seleccionadas, por un lado,
utilizando el método de datos no agrupados y por el otro el de datos agrupados. Nuestra intención es hallar que
tanta diferencia existe entre estos dos tipos de organización de los valores obtenidos, así como el de hallar las
medidas centrales de todas las muestras en conjunto.
TABLA 5. TABLA COMPARATIVA DE LAS MEDIDAS CENTRALES DE LAS IMPORTACIONES FOB NO-
PETROLERAS EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS)
Datos Datos
Estadístico
No agrupados agrupados
Rango 34240.5 34240.5
Media 19125.8 19289.4
Aritmética
Mediana 18107.7 17616.1
Moda 9547 10754.3
Cuartiles
0 4833.3 4833.3
1 11934.1 10004.4
2 18031.2 17583.2
3 26780.8 26413.4
4 39073.7 39073.7
Deciles
4 14873.1 14118.9
8 28448.8212 26695.14176
Percentiles
25 11934.1 10004.4
95 34765.1 35017.2
Los datos agrupados fueron
Información
organizados en 8 clases en total
adicional
para el calculo de los resultados
Como se observa en los resultados obtenidos en la tabla podemos decir a grandes rasgos que nuestra distribución
de valores es bastante extensa, con una variabilidad considerablemente uniforme, lo cual nos indica una cierta
linealidad en el aumento gradual del monto de las importaciones. También cabe señalar que el promedio obtenido
representa un punto moderado tomando en cuenta la dependencia provocada por la importación de bienes.
4.1 Comparación de los diagramas de caja de datos agrupados con no agrupados
A continuación, se presentarán dos diagramas de caja para los datos agrupados y los no agrupados, con el fin de
observar las diferencias que existen entre ellas, también el de visualizar la extensión de la distribución de los
valores de la muestra total, así como la ubicación aproximada de sus medidas centrales.
TABLA 6. DIAGRAMA DE CAJA DE LAS IMPORTACIONES FOB NO-PETROLERAS EN MÉXICO, 1994-2018
(EN MILLONES DE PESOS) (DATOS AGRUPADOS)
Las gráficas obtenidas nos muestran diferencias mínimas entre los diagramas de caja, casi imperceptibles a primera
vista, por lo que sería conveniente afirma que la diferencia entre los datos agrupados y no agrupados es mínima,
por no decir nula. Las graficas en sí nos dicen que existe un sesgo a la izquierda en la distribución de los valores
de las importaciones, y datos más distribuidos y lejanos hacia la derecha.
4.2 Comparación de las medidas de dispersión de datos agrupado y no agrupados.
En esta tabla veremos una comparación de las medidas de dispersión obtenidos según el método de datos no
agrupados y datos agrupados, nuestra intención, al igual que la tabla anterior, es el de conocer que tanta diferencia
existe entre un método y otro, así como el de observar cómo los valores de la muestra total mantienen cierta
distancia cuantitativa entre sí para conocer más a detalle la extensión de la misma.
TABLA 8. TABLA COMPARATIVA DE LAS MEDIDAS DE DISPERSIÓN DE LAS IMPORTACIONES FOB
NO-PETROLERAS EN MÉXICO, 1994-2018 (EN MILLONES DE PESOS)
Datos Datos
Estadístico
No agrupados agrupados
Rango 34239.4 34241.4
Rango
14846.7 16409
intercuartil
Varianza 87743689.2 86341281.4
Desviación
9366.1 9291.9
estándar
Coeficiente de
49.1 47.9
variación
Información Los datos agrupados fueron
adicional organizados en 8 clases en total
Observando los resultados obtenidos podemos decir que los datos tienen una extensión bastante importante, desde
los más pequeños a los más grandes, de forma que inducimos que esto se debe al aumento de los montos de las
importaciones en México a través de los años, aunado a la gradualidad y uniformidad observada en la tabla pasada.
Datos Datos
Estadístico
No agrupados agrupados
Coeficiente de asimetría 0.36 0.49
de Pearson
Coeficiente de asimetría
0.18 0.21
de Yule Browley
Coeficiente de asimetría
0.23 0.16
de Fisher
Coeficiente de asimetría
0.14 0.12
de Excel
Coeficiente de curtosis
-1.1 -1.92
de Fisher
Coeficiente de curtosis
-1.09 -1.21
de Excel
Los coeficientes obtenidos tienen una variación mínima respecto a los datos agrupados y no agrupados,
posiblemente debido a la forma de calcular para uno y otro, pero en términos generales, ambos métodos nos indican
que existe un sesgo de valores hacía la izquierda (O hacia valores menores) de la distribución, así como una
uniformidad en la presentación de los datos, sin picos pronunciados por la acumulación de valores en cierta clase
o cercanía a alguna medida central.
Sección 3: Distribuciones de Probabilidad Discreta
La probabilidad dada es de 0.004468146 que también puede presentarse como 0.4468146%. Esto se calculo
tomando en cuenta la probabilidad de 0.16470588 correspondiente al cuarto intervalo que va desde el 19507.8 al
24399.29, a modo de que los 3 meses a pronosticar cayeran dentro de este rango. El resultado obtenido nos indica
que hay una probabilidad bastante baja de que este hecho ocurra dado que los datos de la distribución están muy
dispersos y no se concentran en algún intervalo especifico.
b) La probabilidad de que en los próximos dos meses (noviembre, diciembre de 2019) la
cantidad esté entre el tercer y quinto intervalo.
La probabilidad obtenida para este caso es de 0.189480969 que también puede presentarse como 18.9480969%.
El calculo se hizo tomando en cuenta que la suma de probabilidades de los intervalos del tercero al cuarto da un
total de 0.435294118. Por tanto, podemos decir que la probabilidad de que en los próximos dos meses el monto
de importaciones caiga dentro de 14616.3 a 29290.79 a primera vista baja, pero tomando en cuenta la dispersión
de la distribución podemos darnos cuenta que es una medianamente alta.
Los datos en conjunto muestran que el modelo de medias móviles es uno que nos brinda valores considerablemente
cercanos a los datos reales, su coeficiente de correlación, aunque nos pueda parecer algo bajo en comparación con
otros tipos de pronostico se encuentra por encima en su precisión. Los índices estacionales nos muestran como los
datos van subiendo y bajando a medida que pasan los meses, en este caso las subidas ocurren desde Junio a
Noviembre y bajan de Diciembre a Mayo, danto un patrón de ciclicidad, estacionalidad y tendencia.
Los datos en conjunto para este caso nos muestran que el modelo de suavizamiento exponencial es el más preciso
para llegar los pronósticos correctos, dado que su coeficiente de correlación (como veremos más adelante) es el
más alto de todos los modelos de pronóstico. Observe como los índices de estacionalidad nos muestran que las
alzas y subidas suelen darse en ciertos meses de manera repetida, comenzando su ascenso en Abril y comenzando
el descenso en Enero, esto resulta en un patrón de ciclicidad, estacionalidad y tendencia.
2. Sección en Equipo
Como queda demostrado por el Coeficiente de Correlación, el equipo llegó a la conclusión que el modelo de tipo
Suavizamiento Especial es el más preciso para la serie de INEGI Importaciones FOB No-Petroleras.
TABLA 4. TABLA DE LA SERIE INEGI IMPORTACIONES FOB NO-PETROLERAS DEL AÑO 2019,
INCLUYENDO LOS DATOS PRONOSTICADOS (EN MILLONES DE PESOS) (MODELO SUAVIZAMIENTO)
Año Importaciones
2019/01 33131.877
2019/02 31515.367
2019/03 33483.007
2019/04 33743.575
2019/05 36228.465
2019/06 31558.555
2019/07 36331.617
2019/08 35821.387
2019/09 33823.1
2019/10 34361.5233
2019/11 34369.4944
2019/12 33976.8127
TABLA 4. GRAFICA DE LA SERIE INEGI IMPORTACIONES FOB NO-PETROLERAS DESDE ENERO DE
2013 HASTA DICIEMBRE DE 2019, INCLUYENDO LOS DATOS PRONOSTICADOS (EN MILLONES DE
PESOS) (MODELO SUAVIZAMIENTO)
Conclusión
La estadística puede ser tanto bien como la utilizada para todos los ámbitos, ningún área del conocimiento se ve
exenta a los posibles abusos que la disciplina puede sufrir a conveniencia de los intereses de grupo o individuos,
podemos terminar este trabajo diciendo que cada día la información falsa se vuelva más y más grande, y nos es
más difícil para nosotros estudiantes, y para las personas comunes, el poder discernir entre la verdad y la mentira,
por ello hay que analizar detenidamente la información aportada y revisar las fuentes pertinentes, y rechazar a
cualquiera que no cuente con ellas.
En otro punto, el buen uso de la estadística nos enseña el camino a seguir en la utilización de esta disciplina,
sirviéndonos de guía para la elaboración de proyectos propios, pero también es de gran ayuda en la vida del
oficinista promedio, alentándolo a usar formulas y ecuaciones pertinentes para hacer su labor de la manera más
eficiente posible, dentro del ámbito estudiantil resulta más útil ya que el saber usar estadística es esencial para la
elaboración y defensa de una tesis.
Para dar por finalizado este trabajo, podemos resumir que, aunque el mal uso de la estadística se halla acrecentado
en los últimos tiempos, no hay que darnos por vencidos contra este mal, ya que lo bueno que le podemos sacar es
aún mayor que la suma de todos sus males, y es nuestro deber informar a los demás sobre las deficiencias de las
noticias y artículos que leen todos los días.
Referencias
Instituto Nacional de Estadística y Geografía. (2019, 1 julio). Banco de Información Económica (BIE).
Recuperado 3 septiembre, 2019, de https://www.inegi.org.mx/Sistemas/BIE/Default.aspx?Topic=0
https://pinetools.com/es/generador-numeros-aleatorios
Anderson, D. and Sweeney, D. (2011). Estadística para negocios y economía (11a. ed.). 11th ed. Distrito Federal:
CENGAGE Learning.