Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INGENIERÍA CIVIL
ITSVA
ASIGNATURA:
Probabilidad y Estadística
INTEGRANTES:
Arceo Can Yordan Alexis
21040002
Cauich Morales Luis Antonio
21040017
Chuc Coba Rommel Manuel
21040029
Colli Cime Jonathan Josue
21040032
Pech Chuc Angel Noe
21040080
DOCENTE:
ARQ. Lucila G. Aguilar Rivero
CURSO:
2do semestre 2022
ACTIVIDAD:
Investigación Tema 5
FECHA DE ENTREGA:
06/06/2022
1
ÍNDICE
ÍNDICE 2
OBJETIVO DE LA INVESTIGACIÓN 3
INTRODUCCIÓN 4
OBJETIVO GENERAL 6
METODOLOGÍA DE LA INVESTIGACIÓN 7
REGRESIÓN Y CORRELACIÓN 8
5.1 Regresión lineal simple, curvilínea y múltiple 9
Regresión lineal simple 9
Regresión curvilínea. 12
Regresión Múltiple 13
5.2 Correlación 15
varianza (s2) 16
covarianza cov(x,y) 17
5.3 Regresión y correlación para datos agrupados 17
Regresión 17
Modelos de regresión 17
Correlación 20
5.4 Correlación de Rangos 23
Correlación. Conceptos asociados 23
Coeficiente de correlación de rangos de Spearman 25
Correlación de Pearson y Correlación de Spearman 28
Correlación y asesor estadístico SPSS 29
Interpretación de la correlación 30
5.5 Coeficiente de correlación para datos nominales 36
CONCLUSIÓN 41
BIBLIOGRAFÍAS 42
2
OBJETIVO DE LA INVESTIGACIÓN
Para empezar el objetivo de esta investigación es dar a conocer los conceptos básicos
de los temas a impartir que son análisis de regresión y correlación, dando las
explicaciones breves de cada uno de los temas, así como también haciendo énfasis en
los subtemas con los que cuenta cada uno. Darle a entender al lector detalladamente
3
INTRODUCCIÓN
aprender, analizar las relaciones que se dan entre variables y resolver los problemas y
casos planteados.
probabilidad. Es muy común que las personas tomen decisiones en la vida cotidiana y
se dieran cuenta que se puede determinar cómo lo conocido se relaciona con un evento
Cualquier método estadístico que tenga como finalidad establecer una ecuación
que permita estimar el valor desconocido de una variable a partir del valor conocido
esta naturaleza que nos permitan establecer la relación neta entre dos variables.
4
Además, se revisarán dos procedimientos de regresión lineal que son: la simple y la
múltiple.
las investigaciones de corte social para predecir amplios rangos de fenómenos que se
que en cualquier momento puede ser modificada por la primera. Por ejemplo,
socioeconómico de las personas es uno de ellos. En este caso las personas con nivel
socioeconómico bajo tienen más riesgos a perder la salud, en este ejemplo el nivel
circunstancias, ni de la otra variable que sería riesgo a la salud. En otros casos existen
relaciones de más de dos variables dependientes. Por lo cual este en este capítulo
revisaremos tanto el caso de dos variables, regresión simple, como de más de dos
5
OBJETIVO GENERAL
comprender temas más avanzados de estadística. Para ello se inicia con la exposición
lograr una mejor comprensión de las técnicas inferenciales. Se aspira asimismo, que
seamos capaz de plantear y resolver problemas reales aplicados a las diferentes ramas
6
METODOLOGÍA DE LA INVESTIGACIÓN
nos serán muy útiles para poder tener una investigación más compleja y entendible,
otra estrategia que utilizaremos para llevar a cabo una buena investigación será los
7
REGRESIÓN Y CORRELACIÓN
de los datos muestrales para saber qué es y cómo se relacionan entre sí dos o más
correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación
8
5.1 Regresión lineal simple, curvilínea y múltiple
permita explicar la relación lineal que existe entre dos variables. A la variable
Y=β0+β1X1+ϵ
último representa la diferencia entre el valor ajustado por la recta y el valor real.
residuo.
valores que minimizan la suma de cuadrados residuales, dando lugar a la recta que
^y ¿ ^β +β^
0 1
x
9
n
S
∑ ¿ 1(x−x )( y− y )= SY =R
^β 0= i x
❑
^B = y −B
^ x
0 1
intersección de la recta con el eje y. Es un dato necesario para generar la recta, pero en
lineal entre dos variables, la recta de regresión lo va a indicar de forma directa. Sin
solo se necesita calcular la recta, sino que además hay que asegurar que el modelo sea
bueno.
Ejemplo:
Y x £
10
Consumo de gasolina de Velocidad Efecto conductor, tipo de carretera,
Regresión curvilínea.
Y= a + bx+cx2
11
2. Se representan dichos valores en los ejes del plano cartesiano, dando lugar a un
diagrama de dispersión o nube de puntos. El cual para que sea curvilínea debe
4. Elaborar tabla con los resultados que según las ecuaciones normales debemos
6. Utilizar matriz para encontrar los parámetros de “a”, “b” y “c” para sustituirlos
completar la tabla.
Regresión Múltiple
(puntuaciones directas):
donde
12
Xi: Variable predictora (o explicativa).
A: Interceptar o constante
donde el primer subíndice indica cuál es la variable criterio y los otros indican cuáles
Coeficiente de determinación:
13
14
5.2 Correlación
cuantitativas continuas (x, y). La manera más sencilla de saber si dos variables están
15
puede ser fortuita, como en el caso clásico de la correlación entre el número de venta
ambiental.
positiva respectivamente. Un valor de r = 0 indica que no existe relación lineal entre
las dos variables. Una correlación positiva indica que ambas variables varían en el
mismo sentido. Una correlación negativa significa que ambas variables varían en
medida del tamaño del efecto, que suele interpretarse de la siguiente manera:
● correlación despreciable: r < |0.1|
varianza (s2)
16
covarianza cov(x,y)
Regresión
Modelos de regresión
y un término aleatorio £.
17
Este modelo puede ser expresado como:
un hiperplano de parámetros desconocidos:
18
El problema de la regresión consiste en elegir unos valores determinados para
errores.
tipo:
19
de los parámetros asociados con la mejor curva de ajuste. Con el fin de determinar si
tales como intervalos de confianza para los parámetros, así como pruebas de bondad
de ajuste.
la función es no lineal en función de pero lineal en función de los parámetros
lineal es necesaria para ajustar polinomios. Las consecuencias prácticas de esta mala
Correlación
que dos variables cuantitativas están correlacionadas cuando los valores de una de
20
ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si
hacen también los de B y viceversa. La correlación entre dos variables no implica, por
nube de puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo
que indica que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o
La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva
21
muestras grandes la variación en dicho coeficiente será menor que para muestras
Si las dos variables aleatorias que trata de relacionarse proceden de una distribución
donde:
de .
for
Aunque, la solución:
22
es subóptima. Se puede obtener un estimador sesgado con mínima varianza para
, i.e.
otros y hallar una respuesta de lo que puede suceder Se pueden encontrar varios tipos
● Regresión logística.
23
Correlación: Expresa grado de asociación entre dos variables, según el sentido
Lineal o curvilínea, según la nube de puntos se condense en torno a una línea recta o a
una curva.
Nula cuando no existe ninguna relación y la nube de puntos están distribuidas al azar.
Funcional si existe una función tal que todos los valores de la nube de puntos la
satisfacen.
COEFICIENTE DE CORRELACIÓN
COEFICIENTE DE DETERMINACIÓN
RHO DE SPEARMAN
24
El coeficiente de correlación no debe utilizarse para comparar dos métodos que
intentan medir el mismo evento, como por ejemplo dos instrumentos que miden la
de Pearson, o ante distribuciones no normales. No está afectada por los cambios en las
unidades de medida. 5
concepto:
que utiliza los rangos, números de orden, de cada grupo de sujetos y compara dichos
rangos. Existen dos métodos para calcular el coeficiente de correlación de los rangos:
uno, señalado por Spearman y otro, por Kendall. El r de Spearman llamado también
Fórmula
25
Otra variante de la fórmula expresada es: 6
colocan según el orden numérico de los datos de la variable. Por ejemplo, si tenemos
Talla Peso
1,6868
1,8970
1,7580
1,5645
1,4848
Talla Peso
33
54
45
21
26
12
El primer valor de talla (en este caso 1,68) se convierte en 3, porque el 1,68 es
didi2
3-3 0
5-4 1
4-5 1
2-1 1
1-2 1
--------
Sustituyendo
correlación entre fuerte y perfecta, lo que se traduce que en la medida que aumentan
27
Correlación de Pearson y Correlación de Spearman
rangos. 8
Presentación de la correlación
mostrar con dos decimales junto con el valor de la p, si el test de hipótesis se realizó
28
elementales de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el
puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que
indica que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o
establece el tipo de línea que define el mejor ajuste: la línea recta, la curva monotónica
o la curva no monotónica. 5
mismos para optimizar el tiempo del que dispone el investigador para el análisis de los
seguir en el asesor
o Gráficos.
o Dispersión.
o Simple.
29
o Definir.
o Analizar.
o Correlación.
o Divariada.
significativas.
Interpretación de la correlación
tiendan a crecer o decrecer juntas no indica que la una tenga un efecto directo o
indirecto sobre la otra. Ambas pueden estar influidas por otras variables de modo que
30
principalmente de los detalles de la investigación y la experiencia propia en el tema de
Escala 1: El coeficiente de correlación oscila entre –1 y +1, el valor 0 que indica que
Escala 2:
Ninguna correlación……………………………………. 0
Escala 3:
1) Perfecta R = 1
31
5) Mala R < 0.5 (6)
0,26-0,50: Débil
Consideraciones de la interpretación
indican una correlación fuerte y negativa. Valores próximos a cero indican que
no hay correlación lineal. Puede que exista otro tipo de correlación, pero no
un signo negativo indica que una variable aumenta a medida que la otra
32
● El personal de salud que investiga debe estar atento a correlaciones que se
menores que 1, los cálculos deben ser revisados pues se incurrió en un error de
proceso.
significación.
de la variabilidad de los datos que se explica por la asociación entre las dos
variables.
con los promedios de la subescala o dimensiones del instrumento (se trabaja con el
33
conocer si existe relación entre estas variables y las actitudes reflejadas en las
diferentes subescalas del CAM. Como puede deducirse del examen visual, la única
Temor. Está correlación es negativa, es decir, a mayor edad de los médicos, menos es
desensibilizador.
hijos puede verse en la Figura 2, donde se aplicó también el método estadístico del
34
Se analizó la relación entre el tiempo de tratamiento y la puntuación final en las
CONCLUSIONES
momentos determinados pueda existir entre dos variables, siendo esta un punto de
35
5.5 Coeficiente de correlación para datos nominales
para variables nominales y ordinales. Por defecto no hay ninguna opción activada.
36
❖ Corrección de continuidad (de Yates): en las tablas 2x2 corrige el error que se
corregido es
calcula como
acotada, Si las variables son independientes se tiene C=0, pero en caso de
37
asociación perfecta nunca alcanza el valor 1. Para tablas cuadradas RxR se puede
3. Phi y V de Cramer:
tabla; para tablas superiores a 2xJ o Ix2 el coeficiente puede tomar valores
mayores que 1.
dimensión de la tabla). Para tablas 2xJ o Ix2 el valor de V coincide con el de .
38
donde fmj es la frecuencia relativa conjunta máxima correspondiente a la columna j-
39
TMCCI=total de elementos mal clasificados con información acerca de
40
CONCLUSIÓN
Para finalizar este tema y a manera de conclusión se puede afirmar que las técnicas de
torno de la mejor línea de ajuste. Ninguna de las dos pruebas respecto a las relaciones
causa-efecto, no es su función.
variables.
41
BIBLIOGRAFÍAS
de https://web.ua.es/es/lpa/docencia/analisis-estadistico-de-datos-geoquimicos-con-r/
regresion-lineal-simple-y-multiple-regresion-no-lineal.html
AC.
AC.
http://www.ub.edu/aplica_infor/spss/cap3-4.htm
http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1729-519X2009000200017
https://cursos.aiu.edu/PROBABILIDAD%20Y%20ESTAD%C3%8DSTICA/4/Word
http://wpd.ugr.es/~bioestad/wp-content/uploads/Metodos-de-regresion.pdf
42