Está en la página 1de 16

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE INGENIERÍA INDUSTRIAL

ASIGNATURA DE ESTADÍSTICA MULTIVARIANTE

Informe de Laboratorio 3: ANOVA

Grupo Nº 3: El chi de la Multivariante

Integrantes:

Apolaya Ronceros, Giulio Francesco - 20170098

Espinoza Ciprino, Nelia Melina - 20170121

Rodriguez Valle, Adriana Karyme - 20170088

Nayra Yajahuanca, Diana - 20170138

Docente:

Ing. Rosales

Lima - Perú

2023
ÍNDICE
1. INTRODUCCIÓN ........................................................................................................... 2

2. PROBLEMÁTICA .......................................................................................................... 3

3. OBJETIVOS..................................................................................................................... 3

3.1. Objetivo principal ........................................................................................................ 3

3.2. Objetivos específicos................................................................................................... 3

4. JUSTIFICACIÓN ............................................................................................................ 4

4.1. Justificación Teórica ....................................................................................................... 4

4.2. Justificación Social ......................................................................................................... 4

4.3. Justificación Económica ................................................................................................. 4

5. MARCO TEÓRICO ........................................................................................................ 5

5.1. Análisis de Varianza de un factor ................................................................................... 5

5.1.1 Datos ......................................................................................................................... 5

5.1.3 Supuestos fundamentales .......................................................................................... 6

6. PROCEDIMIENTO ........................................................................................................ 7

6.1. Variables por analizar ..................................................................................................... 7

6.2. Formulación de la hipótesis ............................................................................................ 7

6.3. Limpieza de datos ........................................................................................................... 7

6.4. Prueba de normalidad ..................................................................................................... 8

7. RESULTADOS .............................................................................................................. 10

8. CONCLUSIONES.......................................................................................................... 14

9. BIBLIOGRAFÍA............................................................................................................ 15

1
1. INTRODUCCIÓN

La distribución de las ganancias mensuales de las personas es un indicador clave

en la evaluación de la calidad de vida y la prosperidad económica en diversas regiones

geográficas. En ese sentido, mediante este estudio, se realizó un análisis de la variación

en las ganancias mensuales de las personas en 4 regiones del Perú utilizando una

herramienta estadística poderosa conocida como análisis de varianza (ANOVA).

El análisis de varianza, conocido comúnmente como ANOVA, es una técnica

estadística fundamental utilizada en la investigación científica y experimental para

analizar la variabilidad entre grupos y determinar si existen diferencias significativas

entre ellos. Esta técnica resulta valiosa cuando se trabaja con múltiples grupos y se

busca evaluar si alguna de las diferencias observadas es estadísticamente significativa.

Este laboratorio tiene como finalidad verificar si los datos de ganancias

mensuales en cada región cumplen con los supuestos necesarios para la aplicación del

ANOVA, tales como la normalidad y la homogeneidad de varianza; además de realizar

un análisis de varianza para determinar si existen diferencias estadísticamente

significativas en las ganancias mensuales entre las 4 regiones geográficas.

Finalmente, los resultados de este estudio proporcionarán información

significativa para la toma de decisiones, tanto a nivel empresarial como en la

formulación de políticas, ya que la identificación de las regiones con diferencias

significativas en las ganancias mensuales puede ayudar a dirigir recursos y estrategias

de manera más efectiva.

2
2. PROBLEMÁTICA

Necesidad de determinar si existen diferencias estadísticamente significativas

en las ganancias mensuales de las personas en diversas regiones geográficas. En el

contexto de un análisis de varianza (ANOVA), se pretende identificar si estas

diferencias son atribuibles a las ubicaciones geográficas en sí o si otros factores pueden

estar influyendo en las variaciones observadas en las ganancias mensuales. El

conocimiento de estas diferencias y sus posibles causas es fundamental para tomar

decisiones informadas en términos de políticas económicas y estrategias empresariales.

3. OBJETIVOS

3.1. Objetivo principal

Analizar la variación en los ingresos mensuales de las personas en diferentes regiones

utilizando el análisis de varianza (ANOVA).

3.2. Objetivos específicos

● Verificar si los datos de ingresos mensuales en cada región cumplen con los

supuestos necesarios para la aplicación del ANOVA, como la normalidad y la

homogeneidad de varianza.

● Realizar el análisis de varianza (ANOVA) para determinar si existen diferencias

significativas en los ingresos mensuales entre al menos tres regiones.

3
4. JUSTIFICACIÓN

4.1. Justificación Teórica

Permite discernir si las diferencias observadas entre tres o más grupos son el

resultado de variabilidad aleatoria o si existe una diferencia estadísticamente

significativa. Esta herramienta es esencial en la investigación científica, ya que facilita

la evaluación de hipótesis y la identificación de factores que pueden influir en una

variable dependiente.

4.2. Justificación Social

Promover la equidad y la justicia en el ámbito social. Este tipo de análisis se

utiliza para evaluar si existen diferencias significativas en el trato entre diferentes

grupos de personas. Por ejemplo, en el ámbito de los recursos humanos, el ANOVA

puede ayudar a determinar si hay disparidades salariales injustas entre grupos de

empleados. Además, en la política pública, esta técnica estadística puede ayudar a

garantizar la asignación justa de recursos y evaluar el impacto de las políticas.

4.3. Justificación Económica

Desempeñar un papel clave en la optimización de recursos y la toma de

decisiones empresariales. En la industria, por ejemplo, puede utilizarse para determinar

si diferentes procesos de producción afectan significativamente la calidad del producto,

lo que permite tomar decisiones informadas sobre la inversión en mejoras. Además, en

marketing y ventas, el ANOVA ayuda a identificar estrategias más efectivas para

diferentes segmentos de mercado, lo que puede resultar en una asignación más eficiente

de recursos y un aumento en los ingresos.

4
5. MARCO TEÓRICO

5.1. Análisis de Varianza de un factor

El análisis ANOVA de un factor es una generalización de la prueba T para dos muestras

independientes al caso de diseños con más de dos muestras. Sirve para comparar varios grupos

en una variable cuantitativa (Lopez, 2022).

● Variable Independiente (VI) o factor: variable categórica (nominal u ordinal) que define

los grupos.

● Variable dependiente (VD): variable cuantitativa en la que se desea comparar los

grupos.

5.1.1 Datos

Los valores de la variable de factor deben ser enteros y la variable dependiente

debe ser cuantitativa (nivel de medida de intervalo).

5.1.2 Hipótesis

La hipótesis que se pone a prueba en el ANOVA de un factor es que las medias

poblacionales ( las medias de la VD en cada nivel de la VI) son iguales.

𝐻𝑜 = 𝜇1 = 𝜇2 = 𝜇3 = . . . = 𝜇𝑛

𝐻1 = 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑑𝑜𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙𝑒𝑠 𝑠𝑜𝑛 𝑑𝑖𝑠𝑡𝑖𝑛𝑡𝑎𝑠

Si las medias poblacionales son iguales, eso significa que los grupos no difieren

en la VD y que, en consecuencia, la VI o factor es independiente de la VD (IBM, 2023).

5
El procedimiento para poner a prueba la Ho consiste en obtener un estadístico,

llamado F, que refleja el grado de parecido existente entre las medias que se están

comparando.

𝜎1 2
𝐹 =
𝜎2 2

● Si las medias poblacionales son iguales, las medias muestrales serán parecidas

existiendo entre ellas tan solo diferencias atribuibles al azar, el coeficiente de F

tomará un valor cercano a 1.

● Si las medias muestrales son distintas, el estadístico F mostrará un valor mayor

que 1. Cuando más diferentes sean las medias mayor será el valor de F.

5.1.3 Supuestos fundamentales

El estadístico F del ANOVA de un factor se basa en el cumplimiento

de dos supuestos fundamentales.

5.1.3.1 Normalidad

Normalidad significa que la variable dependiente se distribuye

normalmente en las poblaciones muestreadas (tantas como grupos definidos por

la variable factor); si los tamaños de los grupos son grandes, el estadístico F se

comporta razonablemente bien incluso con distribuciones poblacionales

sensiblemente alejadas de la normalidad (Universidad de Sevilla, 2020).

5.1.3.2 Homocedasticidad

Homocedasticidad o igualdad de varianzas significa que las poblaciones

muestreadas poseen la misma varianza (Universidad de Sevilla, 2020).


6
6. PROCEDIMIENTO

6.1. Variables por analizar

● Variable dependiente: Ganancia Neta Mensual.

● Variable independiente: Región

6.2. Formulación de la hipótesis

● Hipótesis nula (H0): La media de las ganancias netas mensuales es igual en

todas las regiones.

● Hipótesis alternativa (H1 o Ha): Al menos una de las regiones tiene una media

de ganancias netas mensuales diferente de las demás.

6.3. Limpieza de datos

Ya teniendo las variables a analizar, se realizó una limpieza de datos,

eliminando aquellos datos atípicos de las muestras. Así mismo, antes de someter a los

datos a la prueba, se comprobó que estos tuvieran una distribución normal y que la

cantidad muestral en ambas fuera la misma, luego se procedió a realizar el ANOVA.

Todos estos pasos fueron ejecutados en el software SPSS, los datos obtenidos se

muestran en las siguientes páginas del informe.

7
6.4. Prueba de normalidad

En la imagen inferior se muestra el resumen de procesamiento de casos, se

evidencia que el tamaño muestral es 39, la muestra se redujo dado que se está

considerando a personas que ganen entre s/. 1112 y s/. 2598.

Así mismo se obtuvieron indicadores descriptivos de los datos analizados, tales

como su media, varianza, etc.

El gráfico que se muestra abajo muestra el resultado obtenido luego de realizar

un análisis de normalidad, se obtuvo que el nivel de significancia es igual a 0.05. Es

decir, que es correcto considerar que los datos se adaptan a una distribución normal.

8
Así mismo se muestra la distribución normal de los datos analizados.

Así mismo se realizó un pruebo de normalidad para cada de las regiones, se

obtuvo en cada una de ellas un nivel de significancia mayor a 0,05.

Luego de haber verificado que los datos que adecuan a una distribución de

normalidad se realizó el ANOVA, se analizó tanto la varianza entre los grupos, así

como dentro del mismo grupo.

9
7. RESULTADOS

En nuestros resultados estadísticos descriptivos para la totalidad de los datos,

incluidas todas las regiones, se presentan los siguientes resultados, con una ganancia

neta mínima de S/. 1112 y máxima de S/. 2598.

10
Figura 1

Para la región Costa se presenta con una ganancia neta mínima de S/. 1112 y

máxima de S/. 2163.

Figura 2 - Sierra

Para la región Sierra se presenta con una ganancia neta mínima de S/. 1167 y

máxima de S/. 2275.

11
Figura 3 - Selva

Para la región Selva se presenta con una ganancia neta mínima de S/. 1148 y

máxima de S/. 2466.

Figura 4 - Lima Metropolitana

Para la región de Lima Metropolitana y Callao se presenta con una ganancia

neta mínima de S/. 1254 y máxima de S/. 2598.

12
Figura 5 - Resumen

En la siguiente tabla se resumen todos los resultados obtenidos en el software

estadístico SPSS.

La ANOVA que nos quedó obtuvimos para nuestro estudio se representa en la


siguiente figura.

Figura 7 - ANOVA

Puesto que el nivel de significación observado es de 0,498, que es mayor a 0,05,

debe aceptarse la hipótesis, por lo que debe concluirse que la ganancia neta de las

personas con un trabajo formal en el periodo de un mes no varía para cada una de las

regiones estudiadas.
13
8. CONCLUSIONES

● En conclusión, el análisis de varianza (ANOVA) reveló diferencias significativas en los

ingresos mensuales entre las 4 regiones (resto Costa, Sierra, Selva y Lima

Metropolitana). Este hallazgo sugiere que las ganancias mensuales no son uniformes

en todas las regiones consideradas en el estudio.

● Asimismo, algunos datos atípicos fueron eliminados del análisis para asegurar que se

cumplan los supuestos del ANOVA, esto fue necesario para garantizar la validez de las

conclusiones obtenidas a través de este método estadístico.

● Finalmente, cabe mencionar que este estudio tiene implicaciones significativas para la

toma de decisiones, tanto a nivel empresarial como en la formulación de políticas, ya

que la identificación de las regiones con diferencias significativas en los ingresos

mensuales puede ayudar a dirigir recursos y estrategias de manera más efectiva.

14
9. BIBLIOGRAFÍA

IBM. (2023). Anova de un factor. https://www.ibm.com/docs/es/spss-

statistics/saas?topic=features-one-way-anova

Universidad de Sevilla. (2020). Prueba de Normalidad.

https://personal.us.es/vararey/supuestos-normalidad.pdf

López, R. (2022). ¿Qué es ANOVA?. Raul Lopez. https://www.raullg.com/que-es-

anova-y-para-que-sirve/

15

También podría gustarte