Está en la página 1de 15

Introducción

El presente trabajo consiste en el desarrollo y modelación matemática de los temas


que se refieren al tema 5, a partir de la probabilidad y estadística y los usos que estos
tienen. Por tanto, se ha dispuesto su Estructuración en subtemas de la siguiente
manera: el primer tema aborda la regresión lineal simple, curvilínea y múltiple., a su

Probabilidad y estadística vez representada


con ejercicios que
muestran el
proceso para la
ejecución de cada
uno de estas
incógnita. Así mismo los temas Consecuentes a este se encuentran organizados de la
misma manera esto para una fácil comprensión por parte de los lectores Finalmente
se presentan las conclusiones producto de la investigación realizada por parte de
cada uno de los integrantes de el equipo de trabajo.

Tema 5: Análisis de regresión y correlación.


5.1 Regresión lineal simple, curvilínea y múltiple.
5.2 Correlación.
5.3 Regresión y correlación para datos agrupados.
5.4 Correlación por rangos.
5.5 Coeficiente de correlación para datos nominales.
5.1 Regresión lineal simple, curvilínea y
múltiple.
Santos Loaiza Pedro

Regresión Lineal Simple


La regresión es una técnica estadística utilizada para encontrar una relación numérica
entre dos variables. Entonces, se trata de hallar el parámetro que explique tal relación.
Aquí, se desarrollan modelos de regresión lineal simple y múltiple. Posteriormente se
explicarán las consideraciones de significancia y bondad de ajuste. Este tipo de
regresión solo maneja una variable independiente, a causa de esto el modelo por
estimar únicamente tendrá dos parámetros:

Y=Bo+B1X+e…(1)

Donde:

X= Es la variable independiente.

Y= Es la variable dependiente.

E=Es el error de estimación.

Bo=Es el intercepto u ordenada en el origen.

B1= Es la pendiente de la regresión.

Entonces, la esperanza de (1) es:

E(Y)=Yˆ=E(βo)+E(β1X)+E€Yˆ=β0+β1X

2
Regresión Lineal Múltiple
Sea 𝑌 una variable de respuesta cuantitativa, y al menos una variable de
predicción xi�� es cuantitativa. Para estos casos, el modelo de regresión lineal
múltiple suele ser muy útil:
y=β0+β1x1+β2x2+...+βkxk+e�=�0+�1�1+�2�2+...+����+�

Donde:

● y� es el regresando.
● x1,x2,xk�1,�2,�� son los regresores.
● e� reprenta el error o perturbación aleatoria.
● Los parámetros β0,β1...,βk�0,�1...,�� son fijos y desconocidos.
● Supóngase que se cuenta con una muestra aleatoria de n� datos

Llevando ello a su forma matricial, se obtiene:

Todo conjuntamente en notación matricial


sería:

Expresado de forma compacta:

3
y=Xβ+e�=��+�

Donde:

● y� es un vector nx1
● X� es una matriz n*k
● β� es un vector (k+1)*1
● e� es un vector n*1

Por el método de mínimos cuadrados:

X′Xβˆ=X′y�′��^=�′�

Lo que da:

Regresión curvilínea
La regresión curvilínea es el nombre que se le da a cualquier modelo de regresión
que intente ajustar una curva en lugar de una línea recta.
Los ejemplos comunes de modelos de regresión curvilínea incluyen:

Regresión cuadrática: se utiliza cuando


existe una relación cuadrática entre una
variable predictora y una variable de
respuesta . Cuando se grafica, este tipo de
relación se ve como una «U» o una «U»
invertida en un diagrama de dispersión:

Regresión cúbica: se utiliza cuando existe


una relación cúbica entre una variable
predictora y una variable de respuesta. Cuando
se grafica, este tipo de relación tiene dos
curvas distintas en un diagrama de dispersión:

4
Ambos contrastan con la regresión lineal simple en la que la relación entre la variable
predictora y la variable de respuesta es lineal:

La fórmula de los modelos de regresión curvilínea


Un modelo de regresión lineal simple intenta ajustar un conjunto de datos mediante
la siguiente fórmula:
ŷ=β0+β1x
dónde:

● ŷ: La variable de respuesta
● β 0 , β 1 : Los coeficientes de regresión
● x: la variable predictora
Por el contrario, un modelo de regresión cuadrática utiliza la siguiente fórmula:
ŷ=β0+β1x+β2x2
Y un modelo de regresión cúbica usa la siguiente fórmula:
ŷ=β0+β1x+β2x2+β3x3
Un nombre más general dado a los modelos de regresión que incluyen exponentes
es regresión polinomial , que adopta la siguiente fórmula:
ŷ = β 0 + β 1 x + β 2 x 2 +… + β k x k
El valor de k indica el grado del polinomio. Aunque el grado puede ser cualquier
número positivo, en la práctica rara vez ajustamos modelos de regresión polinomial
con un grado superior a 3 o 4.
Al usar exponentes en la fórmula del modelo de regresión, los modelos de regresión
polinomial pueden ajustar curvas a conjuntos de datos en lugar de líneas rectas.
Cuándo utilizar la regresión curvilínea
La forma más sencilla de saber si debe utilizar la regresión curvilínea es crear un
diagrama de dispersión de la variable predictora y la variable de respuesta.

Si la gráfica de dispersión muestra una relación lineal entre las dos variables, es
probable que sea apropiado utilizar la regresión lineal simple.

Sin embargo, si la gráfica de dispersión muestra un patrón cuadrático, cúbico o algún


otro patrón curvilíneo entre el predictor y la variable de respuesta, entonces es
probable que sea más apropiado usar la regresión curvilínea.
También puede ajustar un modelo de regresión lineal simple y un modelo de regresión
curvilínea y comparar los valores de R cuadrado ajustados de cada modelo para
determinar qué modelo ofrece un mejor ajuste a los datos.
La R-cuadrada ajustada es útil porque le indica la proporción de la varianza en la
variable de respuesta que puede ser explicada por la (s) variable (s) predictoras,
ajustada por el número de variables predictoras en el modelo.
En general, el modelo con el valor R cuadrado ajustado más alto ofrece un mejor
ajuste al conjunto de datos.

5
5.2 Correlación
Del Ángel Olivares José Eduardo

¿Qué es la correlación?
La correlación es una medida estadística que expresa hasta qué punto dos variables
están relacionadas linealmente (esto es, cambian conjuntamente a una tasa
constante). Es una herramienta común para describir relaciones simples sin hacer
afirmaciones sobre causa y efecto.

El coeficiente de correlación de la muestra, r, cuantifica la intensidad de la relación.


Las correlaciones también se someten a pruebas para establecer su significancia
estadística.

La correlación no puede medir la presencia o el efecto de otras variables aparte de las


dos que se están explorando. Es importante saber que la correlación no nos informa
sobre causas y efectos. Además, la correlación no puede describir con precisión las
relaciones curvilíneas.

Tipos de correlación
Según cómo sea la relación que hay entre dos variables aleatorias, se distinguen los
siguientes tipos de correlación lineal:

● Correlación directa (o correlación positiva): una variable aumenta cuando la


otra también aumenta.
● Correlación inversa (o correlación negativa): cuando una variable aumenta
la otra disminuye, y al revés, si una variable disminuye la otra aumenta.
● Correlación nula (sin correlación): no existe ninguna relación entre las dos
variables.

Cómo visualizar la correlación con gráficos de dispersión:

Volviendo al ejemplo anterior: a medida que la altura del camping aumenta, la


temperatura baja. Podemos observar esto directamente con un gráfico de dispersión.
Imagine que hemos representado los datos de nuestros campings:

6
● Cada punto del gráfico representa a un camping, que podemos ubicar en un eje
x e y, con la temperatura máxima en verano en función de la altura.
● El coeficiente de correlación (r) también ilustra nuestro gráfico de dispersión.
Nos dice, en términos numéricos, que tan próximos están los puntos
representados en el gráfico de dispersión a una relación lineal. Las relaciones
más estrechas o los valores de r más grandes son relaciones en las que los
puntos están muy cerca de la línea que hemos ajustado a los datos.

Los gráficos de dispersión también son útiles para determinar si hay algo en nuestros
datos que pueda afectar a una correlación precisa, como patrones poco habituales
(por ejemplo, una relación curvilínea o un valor extremadamente atípico).

Las correlaciones no pueden capturar con precisión las relaciones curvilíneas. En una
relación curvilínea, las variables están correlacionadas en una dirección determinada
hasta cierto punto, en el cual la relación cambia.

Por ejemplo, imagine que estamos observando la altura de los campings y la


puntuación media que les dan los acampantes. Quizás la altura y la puntuación estén
correlacionadas de manera positiva al principio, porque los campings que están más
altos tienen mejores vistas del parque. Pero a partir de cierto punto, las alturas más
elevadas se correlacionan negativamente con las puntuaciones, porque los
acampantes pasan frío por las noches.

7
Podemos obtener aún más información añadiendo elipses de densidad sombreadas a
nuestro gráfico de dispersión. Una elipse de densidad ilustra la región con mayor
densidad de puntos de un gráfico de dispersión, lo que a su vez nos ayuda a ver la
intensidad y la dirección de la correlación.

Las elipses de densidad pueden tener diferentes tamaños. Una elección común para
examinar la correlación son las elipses de densidad del 95 %, que muestran
aproximadamente el 95 % más denso de las observaciones. Si las dos variables
varían conjuntamente, como la altura y la temperatura en nuestros campings,
esperaríamos que la elipse de densidad refleje la forma de la línea.

8
Sección de preguntas

1. ¿Qué es la regresión? La regresión es una técnica estadística utilizada para


encontrar una relación numérica entre dos variables.
2. ¿Cuales son los tipos de regresión?
a. Regresión lineal simple
b. Regresión curvilínea
c. Regresión múltiple

3. ¿Qué es la correlación? La correlación es una medida estadística que


expresa hasta qué punto dos variables están relacionadas linealmente.

4. ¿Cuáles son los tipos de correlación?

a. Correlación directa

b. Correlación inversa

c. 3. Correlación nula

9
Fuentes de consulta

"RPubs - Regresión Lineal Simple y Múltiple" https://rpubs.com/revite19/717614

▷ Correlación: qué es, tipos, fórmula, interpretación,... (probabilidadyestadistica.net)

Microsoft Word - 01. Documento 1 _correlaciones_.doc (unizar.es)

https://statologos.com/regresion-curvilinea/

INTRODUCCION

Este coeficiente se emplea cuando una o ambas escalas de


medidas de las variables son ordinales, es decir, cuando una o
ambas escalas de medida son posiciones. Ejemplo: Orden de llegada
en una carrera y peso de los atletas.
Se calcula aplicando la siguiente
ecuación:

10
Nota: Los datos hay que traducirlos u ordenarlos
en rangos. A los puntajes más elevados le asignamos el
rango 1 al siguiente el rango 2 y así sucesivamente. Si se
repiten dos puntajes o más se calculan las medias
aritméticas.

5.4 CORRELACION POR RANGO


El coeficiente de correlación de Spearman es una medida no paramétrica de
la correlación de rango (dependencia estadística del ranking entre dos
variables). Se utiliza principalmente para el análisis de datos.
Mide la fuerza y la dirección de la asociación entre dos variables
clasificadas. Pero antes de hablar de la correlación de Spearman, es
importante entender la correlación de Pearson, la cual es una medida
estadística de la fuerza de una relación lineal entre datos emparejados.

¿Qué es el coeficiente de correlación de Spearman?


El coeficiente de correlación de Spearman es una medida no paramétrica de
la correlación de rango (dependencia estadística del ranking entre dos
variables). Se utiliza principalmente para el análisis de datos.
Mide la fuerza y la dirección de la asociación entre dos variables
clasificadas. Pero antes de hablar de la correlación de Spearman, es
importante entender la correlación de Pearson, la cual es una medida
estadística de la fuerza de una relación lineal entre datos emparejados.
Te recomiendo leer este artículo sobre las diferencias entre las pruebas no
paramétricas y las pruebas paramétricas.

Para el cálculo y la prueba de significación de la variable de ranking, se


requiere que la siguientes suposiciones de datos sean ciertas:
● Nivel de intervalo o ratio
● Relación lineal
● Bivariante distribuido

11
Si tus datos no cumplen con las suposiciones anteriores, necesitarás el
coeficiente de correlación de Spearman. Para esto, es necesario saber qué
función monótona es para entenderlo.
Una función monótona es aquella que nunca disminuye o nunca aumenta,
ya que es un incremento variable independiente. Puede ser explicada
usando la imagen de abajo:

La imagen explica tres conceptos de la función monótona:


1. Monotónicamente en aumento: Cuando la variable “x” aumenta y la
variable “y” nunca disminuye.
2. Disminuye monótonamente: Cuando la variable “x” aumenta pero la
variable “y” nunca aumenta.
3. No monótono: Cuando la variable “x” aumenta y la variable “y” a
veces aumenta y a veces disminuye.
La relación monótona es menos restrictiva cuando se compara con una
relación lineal que se utiliza en el coeficiente de correlación de Pearson.
Aunque la monotonicidad no es el último requisito, no será significativo
perseguirla sin determinar realmente la fuerza y dirección de una relación
monótona si ya se sabía que la relación entre la variable no es monótona.

Cómo calcular el coeficiente de correlación de Spearman

n= número de puntos de datos de las dos variables


di= diferencia de rango del elemento «n”
El Coeficiente Spearman,⍴, puede tomar un valor entre +1 y -1 donde,
● Un valor de +1 en ⍴ significa una perfecta asociación de rango
● Un valor 0 en ⍴ significa que no hay asociación de rangos

12
● Un valor de -1 en ⍴ significa una perfecta asociación negativa entre los
rangos.

Cómo se usa el coeficiente de correlación de Spearman


En cada nivel, deberás comparar los valores de las dos variables. Aquí
tenemos un ejemplo de cómo funcionan los cálculos:
Los resultados de 9 estudiantes en Historia y Geografía se mencionan en la
siguiente tabla.
Paso 1: Crear una tabla con los datos obtenidos.
Paso 2: Comienza por clasificar los dos conjuntos de datos. La clasificación
de los datos puede lograrse asignando la clasificación «1» al número más
grande de la columna, «2» al segundo número más grande, y así
sucesivamente. El valor más pequeño generalmente obtendrá la
clasificación más baja. Esto debe hacerse para ambos conjuntos de
mediciones.
Paso 3: Agrega una tercera columna “d” a tu conjunto de datos, “d” aquí
denota la diferencia entre los rangos. Por ejemplo, si el rango de física del
primer estudiante es 3 y el rango de matemáticas es 5, entonces la
diferencia en el rango es 3. En la cuarta columna, cuadrar sus valores “d”.

Debemos ser capaces de clasificar los datos antes de proceder con el


coeficiente de correlación de Spearman. Es importante observar que si se
incrementa una variable, la otra sigue una relación monótona.

Historia Rango Georgrafía Rango d d cuadrada

35 3 30 5 2 4

23 5 33 3 2 4

47 1 45 2 1 1

17 6 23 6 0 0

10 7 8 8 1 1

43 2 49 1 1 1

9 8 12 7 1 1

6 9 4 9 0 0

13
28 4 31 4 0 0

12

Paso 4: Sumar todos los valores del cuadrado “d” que es 12 (∑d cuadrada).
Paso 5: Insertar estos valores en la fórmula.

=1-(6*12)/(9(81-1))
=1-72/720
=1-01
=0.9
El coeficiente de correlación de Spearman para estos datos es de 0.9 y como se
mencionó anteriormente si el valor de ⍴ se acerca a +1 entonces tienen una
asociación perfecta de rango.

PREGUNTAS:
1. ¿Qué tipo de variables son adecuadas para ser analizadas con la
correlación por rango de Spearman?
Respuesta: La correlación por rango de Spearman es adecuada para
analizar la relación entre dos variables continuas que no necesariamente
tienen una distribución normal, sino que pueden tener una distribución
sesgada o no lineal.

2. ¿Qué valores puede tomar el coeficiente de correlación de Spearman y


qué significan?

14
Respuesta: El coeficiente de correlación de Spearman puede tomar valores
entre -1 y 1. Un valor de -1 indica una correlación negativa perfecta, es
decir, que a medida que aumenta una variable, la otra disminuye en forma
perfectamente lineal. Un valor de 0 indica que no hay correlación entre las
variables. Un valor de 1 indica una correlación positiva perfecta, es decir,
que a medida que aumenta una variable, la otra también aumenta en forma
perfectamente lineal.

FUENTES:
https://www.questionpro.com/blog/es/coeficiente-de-correlacion-de-
spearman/
https://www.monografias.com/trabajos85/coeficiente-correlacion-rangos-
spearman/coeficiente-correlacion-rangos-spearman

15

También podría gustarte