Está en la página 1de 16

Tecnológico Nacional de México Instituto Tecnológico de Tijuana

SUBDIRECCIÓN ACADÉMICA

DEPARTAMENTO DE SISTEMAS Y COMPUTACIÓN

SEMESTRE SEPTIEMBRE 2020 – ENERO 2021

Ingeniería en Sistemas Computacionales

AEF-1052SC2A Probabilidad y estadística

Investigación Unidad 5

Unidad 5 – Regresión Lineal.

Nombre Alumno: Osorio Cuevas Daniel Alejandro #20210607

Nombre Maestra: GABRIELA ELIZABETH MARTINEZ MENDIVIL

Fecha de Entrega 15 de enero de 2021

1
Contenido
5.1 Regresión y correlación. ..................................................................................................................... 2
5.1.1 Diagrama de dispersión. ................................................................................................................. 3
5.1.2 Regresión lineal simple. .................................................................................................................. 6
5.1.3 Correlación. ....................................................................................................................................... 7
Tipos de correlación .................................................................................................................................. 7
1. Correlación directa ................................................................................................................................ 7
2. Correlación inversa ............................................................................................................................... 8
3. Correlación nula .................................................................................................................................... 8
Ejemplo: .................................................................................................................................................... 8
5.1.4 Determinación y análisis de los coeficientes de correlación y de determinación. ................. 9
Cálculo Caso general ............................................................................................................................... 10
Regresión Lineal ...................................................................................................................................... 10
Ejemplo: .................................................................................................................................................. 11
5.1.5 Distribución normal bidimensional. .............................................................................................. 11
Ejemplo: .................................................................................................................................................. 12
5.1.6 Intervalos de confianza y pruebas para el coeficiente de correlación. .................................. 12
Ejemplo: .................................................................................................................................................. 12
5.1.7 Errores de medición. ...................................................................................................................... 13
1- Error aleatorio..................................................................................................................................... 13
Ejemplo: .................................................................................................................................................. 13
2- Error sistemático ................................................................................................................................. 13
Ejemplo: .................................................................................................................................................. 13
Conclusión .................................................................................................................................................. 14
Bibliografía .................................................................................................................................................. 14

5.1 Regresión y correlación.


La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden
una forma de estimación. En forma más especifica el análisis de correlación y regresión
2
comprende el análisis de los datos muestrales para saber qué es y cómo se relacionan
entre si dos o más variables en una población. El análisis de correlación produce un
número que resume el grado de la correlación entre dos variables; y el análisis de
regresión da lugar a una ecuación matemática que describe dicha relación. El análisis de
correlación generalmente resulta útil para un trabajo de exploración cuando un
investigador o analista trata de determinar que variables son potenciales importantes, el
interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de
una entre variables; la regresión da lugar a una ecuación que describe dicha relación en
términos matemáticos. Los datos necesarios para análisis de regresión y correlación
provienen de observaciones de variables relacionadas.
Ejemplo:

5.1.1 Diagrama de dispersión.


El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados
de datos que aparecen en pares (por ejemplo, (x,y), uno de cada conjunto). El diagrama
3
muestra estos pares como una nube de puntos. Las relaciones entre los conjuntos
asociados de datos se infieren a partir de la forma de las nubes.
 Una relación positiva entre x y y significa que los valores crecientes de x están
asociados con los valores crecientes de y.
 Una relación negativa significa que los valores crecientes de x están asociados
con los valores decrecientes de y.
¿Para qué se usa un diagrama de dispersión?
Entre sus usos está descubrir y mostrar las relaciones entre dos conjuntos asociados de
datos y confirmar relaciones anticipadas entre dos conjuntos asociados de datos. El
diagrama de dispersión puede estudiar la relación entre:
 Dos factores o causas relacionadas con la calidad.
 Dos problemas de calidad.
 Un problema de calidad y su posible causa.
Ejemplo:
Una empresa de fabricación de jabón se plantea cambiar la composición de uno de sus
productos utilizando una nueva materia prima. Antes de tomar una decisión, la empresa
decide realizar un ensayo para estudiar la posible relación entre la utilización dicha
materia prima y el número de no conformidades. Para ello analiza lotes con diferentes
porcentajes de la nueva materia prima y toma los siguientes datos:

4
Con estos datos, elaboraremos el siguiente diagrama de dispersión:

5
5.1.2 Regresión lineal simple.
¿Qué es regresión lineal simple?
La regresión lineal simple examina la relación lineal entre dos variables continuas: una
respuesta (Y) y un predictor (X). Cuando las dos variables están relacionadas, es posible
predecir un valor de respuesta a partir de un valor predictor con una exactitud mayor que
la asociada únicamente a las probabilidades. La regresión proporciona la línea que
"mejor" se ajusta a los datos. Esta línea se puede utilizar después para:
 Examinar cómo cambia la variable de respuesta a medida que cambia la variable
predictora.
 Predecir el valor de una variable de respuesta (Y) para cualquier variable
predictora (X).
¿Qué es regresión lineal múltiple?
La regresión lineal múltiple examina las relaciones lineales entre una respuesta continua
y dos o más predictores. Si el número de predictores es grande, antes de ajustar un
modelo de regresión con todos los predictores, se deberían utilizar las técnicas de
selección de modelo paso a paso o de los mejores subconjuntos para excluir los
predictores que no estén asociados con las respuestas. Constantemente en la práctica
de la investigación estadística, se encuentran variables que de alguna manera están
relacionadas entre sí, por lo que es posible que una de las variables puedan relacionarse

6
matemáticamente en función de otra u otras variables. Maneja varias variables
independientes. Cuenta con varios parámetros. Se expresan de la forma:

𝑌𝑖 = 𝛽0 + ∑ 𝛽𝑝𝑋𝑝𝑖 + 𝜀𝑖

Ejemplo:

5.1.3 Correlación.
En el ámbito de las matemáticas y las estadísticas, la correlación alude a la
proporcionalidad y la relación lineal que existe entre distintas variables. Si los valores de
una variable se modifican de manera sistemática con respecto a los valores de otra, se
dice que ambas variables se encuentran correlacionadas. Supongamos que tenemos
una variable R y una variable S. Al aumentar los valores de R, aumentan los valores de
S. De igual modo, al aumentar los valores de S, se incrementan los valores de R. Por lo
tanto, hay una correlación entre las variables R y S.

Tipos de correlación
1. Correlación directa
La correlación directa se da cuando al aumentar una de las variables la otra aumenta. La
recta correspondiente a la nube de puntos de la distribución es una recta creciente.

7
2. Correlación inversa
La correlación inversa se da cuando al aumentar una de las variables la otra disminuye.
La recta correspondiente a la nube de puntos de la distribución es una recta decreciente.

3. Correlación nula
La correlación nula se da cuando no hay dependencia de ningún tipo entre las variables.
En este caso se dice que las variables son incorreladas y la nube de puntos tiene una
forma redondeada.

Ejemplo:
En un estudio de la relación entre malestar físico subjetivo y depresión hallan que la
correlación entre las dos variables es igual a 0.6 en una muestra de 35 pacientes de
depresión seleccionados aleatoriamente. Saben que la correlación entre estas
variables en la población de individuos sin depresión es igual a 0.4 (valor ficticio), y
quieren saber si la diferencia es estadísticamente significativa.

a) Supuestos:

Se asume que los supuestos son satisfechos dado que hemos seleccionado
aleatoriamente los individuos de la muestra.

b) Hipótesis:

8
alfa=0.05

c) Estadístico de contraste:

donde Zr es la transformada de Fisher del coeficiente de correlación de Pearson.

d) Distribución del estadístico de contraste: Normal.

e) Significación del estadístico de contraste: 0.06

f) Decisión: La significación del estadístivo de contraste es superior a 0.05 se acepta la


Hipótesis Nula.

g) Intervalo de confianza:

Con un nivel de confianza del 95% se concluye que la correlación poblacional toma un
valor entre 0.34 y 1. Conclusión: La diferencia entre la correlación observada en la
muestra y la correlación poblacional no es estadísticamente significativa.

5.1.4 Determinación y análisis de los coeficientes de correlación y de


determinación.
En esta caso vamos a revisar lo que es el coeficiente de correlación y el de
determinación, de hecho, se usa cuando en una gráfica ponen una línea de tendencia y
ponen lo que hasta ahora conocen como R2, ese es el coeficiente de determinación en
tanto que su raíz cuadrada, o sea R (más correctamente r) es el coeficiente de
correlación. Una correlación, es simplemente la relación o dependencia que existe entre
las dos variables que intervienen en una distribución bidimensional. Es decir, la
correlación nos indica si los cambios en una de las variables (la independiente) influyen
en los cambios de la otra (dependiente). En caso de que suceda, diremos que las
variables están correlacionadas o que hay correlación entre ellas. Si bien la correlación
puede ser exponencial o potencial o lineal, por ahora solo veremos la correlación lineal
o de Pearson

9
Cálculo Caso general
Un modelo estadístico se construye para explicar una variable aleatoria, que llamaremos
dependiente, a través de otras variables aleatorias a las que llamaremos factores. Dado
que podemos predecir una variable aleatoria mediante su media y que, en este caso, el
error cuadrático medio es su varianza, el máximo error cuadrático medio que podemos
aceptar en un modelo para una variable aleatoria que posea los dos primeros momentos
es la varianza. Para estimar el modelo haremos varias observaciones de la variable a
predecir y de los factores. A la diferencia entre el valor observado de la variable y el valor
predicho la llamaremos residuo. La media cuadrática de los residuos es la varianza
residual. Si representamos por 𝜎 2 la varianza de la variable dependiente y la varianza
residual por 𝜎 2 , el coeficiente de determinación viene dado por la siguiente ecuación:

2
𝜎𝑟2
𝑝 =1 2
𝜎
Regresión Lineal
Para la regresión basta con hacer el cuadrado del coeficiente de correlación de Pearson.
𝜎 2 𝑋𝑌
𝑅2 =
𝜎 2 𝑋𝜎 2 𝑌

10
Ejemplo:

5.1.5 Distribución normal bidimensional.


Son aquellas en las que a cada individuo le corresponden los valores de dos variables,
las representamos por el par (xi, yi). Si representamos cada par de valores como las
coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama
de dispersión. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo
mejor posible, llamada recta de regresión.

11
Ejemplo:

Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:

Matemáticas Física
2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
7 6
8 7
10 9
10 10

5.1.6 Intervalos de confianza y pruebas para el coeficiente de correlación.


En estadística, se llama intervalo de confianza a un par o varios pares de números entre
los cuales se estima que estará cierto valor desconocido con una determinada
probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se
calcula a partir de datos de una muestra, y el valor desconocido es un parámetro
poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se
denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o
nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación
mediante tal intervalo.

Ejemplo:

12
5.1.7 Errores de medición.
El error de medición se define como la diferencia entre el valor medido y el "valor
verdadero". Los errores de medición afectan a cualquier instrumento de medición y
pueden deberse a distintas causas. Las que se pueden de alguna manera prever,
calcular, eliminar mediante calibraciones y compensaciones, se denominan
deterministas o sistemáticos y se relacionan con la exactitud de las mediciones. Los que
no se pueden prever, pues dependen de causas desconocidas, o estocásticas se
denominan aleatorios y están relacionados con la precisión del instrumento.

1- Error aleatorio
Los errores aleatorios son aquellos que se dan cuando se hacen medidas consecutivas
de un mismo objeto o fenómeno, obteniendo valores diferentes en cada caso. En las
ciencias sociales los errores aleatorios están representados por condiciones que afecten
de manera particular a un miembro de la muestra que está siendo analizada.

Ejemplo:
Se está estudiando el desempeño de un grupo de alumnos en los deportes. Hay cientos
de elementos que afectan a cada joven, como las horas de sueño que ha tenido, el
humor, la condición física, entre otros. Cabe destacar que estas condiciones no
intervienen en la actuación del grupo, sino en la de un solo individuo, lo que añade
diferencias interesantes en los datos obtenidos.

2- Error sistemático
A diferencia de los errores aleatorios, los errores sistemáticos dependen directamente
del sistema que se está empleando para realizar la medición. Por este motivo, son
errores constantes. Si se emplean instrumentos descalibrados, estos arrojarán medidas
erróneas. El error se va a presentar incluso si se repite el proceso de medición. En las
ciencias sociales, el error sistemático se produce cuando hay una condición que afecte
de manera general el desempeño de todos los individuos de la muestra.

Ejemplo:
Un grupo de estudiantes debe presentar un examen sorpresa sobre un contenido que no
se ha visto a profundidad en clases.
Se espera que el resultado de la evaluación sea pobre en cada caso, lo que representa
un error sistemático.

13
Conclusión
En conclusión todos los temas vistos en esta unidad y en este trabajo tiene su
complejidad pero al momento de realizarlo no lo entendí muy bien pero viendo los
ejemplo fue cuando le empece a entender un poco ma sa cada tema ya que viene un
poco mas practico y es un poco mas fácil de entender que solamente la teoría que
viene en si aunque la teoría ayuda mucho, pero con ejemplos se complementa muy
bien ya que estas viendo que es lo que se hace con cada uno de los datos que se te
proporcionan.

Bibliografía
https://sites.google.com/site/estadisticadescriptivaenedu/home/unidad-1/6---regre

14
https://www.cienciadedatos.net/documentos/24_correlacion_y_regresion_lineal#:~:text=
La%20correlaci%C3%B3n%20cuantifica%20como%20de,a%20partir%20de%20la%20
otra
https://www.ingenieriaindustrialonline.com/pronostico-de-la-demanda/regresion-lineal/
https://aprendiendocalidadyadr.com/diagrama-de-dispersion/
https://ingenioempresa.com/diagrama-de-dispersion/
https://docs.tibco.com/pub/spotfire_web_player/6.0.0-november-2013/es-
ES/WebHelp/GUID-780960FA-1DCE-4E59-8EB7-54F7144DB362.html
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-
statistics/regression/supporting-topics/basics/types-of-regression-analyses/#what-is-
simple-linear-regression
https://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal#Regresi%C3%B3n_lineal_simple
https://personal.us.es/vararey/regresion-simple.pdf
https://definicion.de/correlacion/#:~:text=En%20el%20%C3%A1mbito%20de%20las,qu
e%20existe%20entre%20distintas%20variables.
https://www.maximaformacion.es/blog-dat/que-es-la-correlacion-estadistica-y-como-
interpretarla/
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/disbidimension/correl
acion.html
http://babbiotics.blogspot.com/2018/10/coeficiente-de-correlacion-y-de.html
https://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/disbidimension/distri
buciones-bidimensionales.html
https://www.aulafacil.com/cursos/estadisticas/gratis/distribuciones-bidimensionales-
l11222
http://www.epsilones.com/epsiclas/material/t-probabilidad/prob-002-distribuciones.pdf
http://blogeducativope-t5.blogspot.com/2018/05/516-intervalos-de-confianza-y-
pruebas.html
https://es.wikipedia.org/wiki/Intervalo_de_confianza
https://bookdown.org/aquintela/EBE/intervalos-de-confianza.html
http://blogeducativope-t5.blogspot.com/2018/05/517-errores-de-medicion.html
https://es.wikipedia.org/wiki/Error_de_medici%C3%B3n#:~:text=El%20error%20de%20
medici%C3%B3n%20se,pueden%20deberse%20a%20distintas%20causas.

15
https://www.fisicalab.com/apartado/errores-de-medida
https://www.lifeder.com/tipos-errores-medicion/
http://asignaturas.topografia.upm.es/matematicas/Estadistica/Problemas/Problemas_re
gresion.pdf
https://aprendiendocalidadyadr.com/diagrama-de-dispersion/
http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-
DPTO/MATERIALES/Mat_50140116_Regr_%20simple_2011_12.pdf
https://www.uv.es/webgid/Inferencial/51_correlacin.html
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/disbidimension/distri
buciones-bidimensionales.html
https://prezi.com/9valk6u25got/514-determinacion-y-analisis-de-los-coeficientes-de-
correl/?fallback=1
http://www.ics-aragon.com/cursos/salud-publica/2014/pdf/M2T05.pdf

16