Está en la página 1de 13

ANÁLISIS DE DATOS

Unidad 3: Análisis de varianza “PROYECTO INTEGRADOR ETAPA 2”


OBJETIVO
El objetivo del Proyecto es encontrar datos provenientes de los procesos, ya sea
académicos, empresariales o de algún otro sector de tal forma que se obtengan modelos de
comportamiento a través de la regresión y/o la correlación de las variables involucradas.
Seguidamente se puede ejemplificar mediante pruebas de ANOVA el comportamiento de
los datos que previamente se han estudiado de manera particular, con el fin de generalizar
el comportamiento del modelo obtenido. Finalmente se investigarán y analizarán otras
formas de descripción de los datos utilizando estadística no paramétrica

I. EXTRACCIÓN DE LOS DATOS NECESARIOS PARA LA EXPERIMENTACIÓN


1.1 Encontrar alguna fuente de datos suficientemente grande (mayor a 30 individuos)
• Encontrar una fuente de datos de algún proceso empresarial, académico, o de la vida
diaria que pueda ser recolectado por paloteo o cuenta simple
• Es importante que los datos sean mayores que 30 individuos, ya que esto es una población
significativa.
Para este trabajo, analizaremos un conjunto de datos conformada por 39 observaciones que
relacionan los tiempos de gestación y la longevidad de diferentes animales

1.2 Extraer de la fuente dada los datos a estudiar y establecer la(s) variable(s) a estudiar.
• Dada toda la fuente que produce datos, se debe establecer cuales datos y sus frecuencias,
o los términos en los que el proceso se describe, se van a estudiar.
• Establecer el conjunto de variables o variable que se va a estudiar con respecto de esos
datos y cómo se comporta con respecto a los otros datos.
Analizaremos las 2 variables de la tabla (longevidad y días de gestación) y mediante su
estudio observaremos si existe una correlación entre la vida de un animal y el tiempo que
tarda en gestarse
II. REALIZAR EL ANÁLISIS DE REGRESIÓN Y CORRELACIÓN DE LOS DATOS
2.1 Realizar un diagrama de dispersión de los datos recolectados
• Elegir un software como Excel o Minitab (preferentemente), entre otros muchos, donde se
pueda realizar tabulación y los cálculos estadísticos pertinentes al proyecto.
Los datos se analizaron en Minitab
• Realizar mediante el software elegido, una tabulación de todos los datos, tanto variables
dependientes como independiente.

• Obtener un diagrama de dispersión mediante el software de elección y resaltar las


variables dependientes.
2.2 Realizar la correlación de los datos para las variables seleccionados.
• Mediante el uso del software elegido, utilizar sus funciones para obtener los coeficientes
de correlación lineal y/o polinómica

• Realizar en a lo más tres líneas una interpretación de los parámetros de la “función”


obtenida. Página 4 de 5 2.3 Obtener la recta de regresión lineal o polinómica y realizar
pruebas de significancia
• Utilizar el software seleccionado para realizar la regresión lineal y/o polinómica. •
Obtener los parámetros de la función de regresión y colocarla en la
• Realizar pruebas de significancia con respecto a los parámetros obtenidos y realizar
una discusión en tres o cuatro líneas a lo mucho

CONCLUSIONES
El llevar el análisis de datos a un método multivariable o polinomial es de gran ayuda, ya
que la mayoría de los casos que se llegan a analizar tienen más de una “supuesta
dependencia”, ahora bien, ha sido muy complejo el poder realizar análisis de las variables
para poder seleccionar las correctas, ya que nuestros análisis multivariables pudieran verse
afectados por el simple hecho de tener una variable que no es significativa.
REFERENCIAS
• Walpole, R., Myers, R., y Myers, S. (2012). Probabilidad y Estadística para Ingeniería y
Ciencias Haga clic para ver más opciones (9ª Edic.) [Archivo PDF]. Recuperado de
https://vereniciafunez94hotmail.files.wordpress.com/2014/08/8va- probabilidad-y-
estadistica-para-ingenier-walpole_8.pdf
• Universidad Técnica Particular de la Loja (Productor). (13 de mayo de 2012). UTPL
análisis de regresión: construcción de modelos, Área Administrativa, Estadística II
[Archivo de Video]. Recuperado de https://www.youtube.com/watch?v=xSf9c-sigjk
• Mendenhall, B. (2010). Introducción a la Probabilidad y Estadística Haga clic para ver
más opciones (13ª Edic.) [Archivo PDF]. Recuperado de
https://www.fcfm.buap.mx/jzacarias/cursos/estad2/libros/book5e2.pdf
• ASCEH. (2002). Construcción de modelos de regresión multivariantes Haga clic para ver
más opciones [Archivo PDF]. Recuperado de
https://www.alceingenieria.net/bioestadistica/regresion1.pdf
• Amat, J. (2016). Introducción a la regresión Lineal Múltiple Haga clic para ver más
opciones [Archivo PDF]. Recuperado de
https://github.com/JoaquinAmatRodrigo/Estadistica-con-
R/blob/master/PDF_format/25_Regresi%C3%B3n_lineal_m%C3%BAltiple.pdf
• Camacho, C. (2021). Regresión Múltiple, Análisis de Datos 2 Haga clic para ver más
opciones [Archivo PDF]. Recuperado de
https://personal.us.es/vararey/adatos2/multiple.pdf

Etapa 2 del Proyecto integrador


Introducción
Para la siguiente etapa del proyecto, continuaremos con el análisis de la tabla de datos del
proyecto integrador etapa 1.
Para esta etapa se planea estudiar el método ANOVA y mediante su metodología analizar los
datos que se recabaron de la tabla anterior. Es importante recortar, que
esta metodología funciona para la comparación de medidas entre factores específicos, los
cuales nos llevarán a crear hipótesis sobre los resultados de los mismos datos.
Esperamos poder concluir con las pruebas a las hipótesis planeadas mediante
justificaciones por la metodología utilizada.

III. ANOVA de un factor


3.1 Identificación de factor (tiempo, factores físicos, ambientales, etc.) que afecta los
datos
Se utilizarán los datos de la tabla del proyecto integrador etapa 1 para analizar la diferencia
entre las gestaciones de los animales y analizaremos si existe una relación entre la vida
promedio de los animales y el periodo de gestación de las mismas.
Para esta etapa del proyecto, se agregará una columna en la que se describirá si el animal en
cuestión es pequeño, mediano o grande. Para que de ahí poder obtener más datos de estudio
y ver de qué manera pudiese o no influir el tamaño del animal en el tiempo de vida y el
tiempo de gestación.
Motivo por el cual, las tabla que se utilizará para esta parte del estudio, es la siguiente:
3.2 Prueba de ANOVA de un factor a una muestra de los datos
¿El promedio de las longevidades de los grupos de animales son iguales?
3.3 Verificación de los supuestos del modelo: Normalidad, Varianza Constante e
Independencia
IV. ANOVA de dos factores
4.1 Prueba de ANOVA de dos factores para establecer la interacción de los factores (si los
datos lo permiten)
4.2 Verificación de los supuestos del modelo: Normalidad, Varianza Constante e
Independencia * Se incluyen capturas de pantallas sobre el desarrollo y los resultados
obtenidos en cada ejercicio realizado en Minitab.

Por lo tanto, se rechazan ambas hipótesis nulas, la longevidad y el tamaño no tienen


relación directa con el periodo de gestación de los animales. Las medias de las
observaciones agrupadas por el otro factor son iguales y no hay interacción entre factores.
Referencias
 Gutíerrez, H. y De la Vara, R. (2008). Análisis y Diseño de Experimentos Haga clic
para ver más opciones [Archivo PDF]. Recuperado de
https://gc.scalahed.com/recursos/files/r161r/w19537w/analisis_y_diseno_ex
perimentos
 Cortés, J., González, J., Rufino, H., Riba, l., y Cobo, E. (2014). Tamaño
muestral Haga clic para ver más opciones [Archivo PDF]. Recuperado de
http://www.ub.edu/ceea/sites/all/themes/ub/documents/Tamano_muestral.p df
 Spiegel, M. y Stephens, L. (2004). Estadística (4ta Edic.) [Archivo PDF].
Recuperado de
https://docs.google.com/viewer?a=v&pid=sites&srcid=ZGVmYXVsdGRvbW
Fpbnx1bGlzZXNtZXJjYWRvdmFsZW56dWVsYXxneDo2YWZjYTIwOTVhYz
RlMDY0
 Matefacil (Productor). (16 de octubre de 2015). Ecuación de Correlación Lineal y
Coeficiente de Correlación (Ejercicio 1) [Archivo video]. Recuperado de
https://www.youtube.com/watch?v=fNeXC8d5En8
 Jiménez, R. (Productor). (22 de abril de 2019). 4-5 Shapiro Wilk - Test de
Normalidad en Excel [Archivo de video]. Recuperado de
https://www.youtube.com/watch?v=ADXl-nTa5CU
 Garay, A. (Productor). (16 de marzo de 2020). Prueba de Barlett [Archivo de
video]. Recuperado en https://www.youtube.com/watch?v=8rxrVmBL29s
 Quintanar, E. (Productor). (22 de marzo de 2018). Análisis de Residuos [Archivo de
video]. Recuperado de https://www.youtube.com/watch?
v=8k6FEDBYvAM

También podría gustarte