Documentos de Académico
Documentos de Profesional
Documentos de Cultura
REYNOSA, TAMAULIPAS.
26/JULIO/22
Análisis de datos
Notas de autor
Jesica Celaya Tejeda, Ingeniería Industrial y de Sistemas, Universidad del Valle de México
La correspondencia relacionada con esta investigación debe ser dirigida a Jesica Celaya
Tejeda
Universidad del Valle de México, Av Conductores 503-A, Peña Guerra, 66490 San
Nicolás de los Garza, N.L.
Contacto: A870204227@my.uvm.edu.mx
Introducción
1.2 Extraer de la fuente dada los datos a estudiar y establecer la(s) variable(s) a
estudiar.
• Dada toda la fuente que produce datos, se debe establecer cuales datos y
sus frecuencias, o los términos en los que el proceso se describe, se van a
estudiar.
• Establecer el conjunto de variables o variable que se va a estudiar con
respecto de esos datos y cómo se comporta con respecto a los otros datos.
II. Realizar el análisis de regresión y correlación de los datos
2.1 Realizar un diagrama de dispersión de los datos recolectados
• Elegir un software como Excel o Minitab (preferentemente), entre otros
muchos, donde se pueda realizar tabulación y los cálculos estadísticos
pertinentes al proyecto.
• Realizar mediante el software elegido, una tabulación de todos los datos,
tanto variables dependientes como independiente.
• Obtener un diagrama de dispersión mediante el software de elección y
resaltar las variables dependientes.
18 17.05
25 19.8
18 15.98
28 22.07
31 22.83
33 24.55
40 27.27
28 23.57
20 13.58
27 22.8
26 20.3
22 16.59
21 16.59
23 16.84
21 17.71
22 25.45
24 28.54
27 22.78
38 15.65
33 25.96
22 25.63
50 37.96
30 19.42
26 20.53
23 15.88
20 13.6
18 15.92
31 22.63
40 27.7
Gráfica 1. Diagrama de dispersión
2.2 El método que más se utiliza para determinar si existe asociación lineal entre
dos variables cuantitativas continuas es el Análisis de Correlación de Pearson.
Con ayuda de este método se obtiene el Coeficiente de Correlación de Pearson, el
cual se representa por la letra R. Se utiliza una muestra, por lo que se obtiene un
estimado del coeficiente de correlación poblacional, r.
Para poder obtener este estimado del coeficiente de correlación no se necesita
conocer la distribución de probabilidad de cada variable; pero, como se obtiene a
partir de una muestra se deben tener indicadores como la variabilidad del valor
estimado, el error estándar o el intervalo de confianza.
Además, se deben realizar pruebas de hipótesis, por ejemplo, para determinar si
el coeficiente es estadísticamente diferente de cero.
Una prueba de hipótesis sobre el coeficiente de correlación se puede establecer
en los términos siguientes:
2.3
Análisis de Varianza
Fuente GL SC MC F P
Regresión 1 425.003 425.003 28.41 0.000
Error 27 403.919 14.960
Total 28 828.922