Está en la página 1de 19

ESTADÍSTICA II

Leidy Jhojana Anaya Tamara - Grupo 13


TEMÁTICAS A DESARROLLAR
m RYC

COVARIANZ DIAGRAMA REGRESIÓN Y


A DE CORRELACIÓN
DISPERSIÓN LINEAL

Y=mx+b
r r²
ECUACIÓN COEFICIENTE COEFICIENTE
DE DE DE
REGRESIÓN CORRELACIÓN DETERMINACI
ÓN
PREDICCI ESTIMACIÓN
ÓN PUNTUAL
COVARIANZA
Simbolizado por: cov m Sxy
Es una medida de dispersión que, a diferencia de las varianzas que siempre dan
resultados positivos, esta puede ser positiva o negativa.

Definición:
FORMULA
“la media del producto de las
diferencias entre los valores de las S
variables, su media aritmética nos
determina la variabilidad conjunta
de X y Y.”
COVARIANZA
ASPECTOS CLAVES DE LA COVARIANZA
o No es indicado usarla para medir la dependencia ya que no existe ninguna unidad de medida
estandarizada.

o Si la covarianza es positiva, indica una pendiente positiva, por ejemplo en el caso de una recta,
esta seria ascendente, si por el contrario es negativa, la línea seria descendente.

NOTA: Si la mayoría de los puntos se sitúan en las secciones inferior izquierda y superior derecha,
la covarianza es positiva; caso contrario, si los puntos se sitúan en la parte inferior derecha y
superior izquierda, es indicativo de una covarianza negativa, esto se puede observar en un
diagrama de dispersión.
DIAGRAMA DE DISPERSIÓN
En un plano cartesiano, se representan tantos puntos como
pares de observación se tengan, poniendo a cada punto un par
de observación. A esta representación grafica se le denomina:
Diagrama de dispersión, de esparcimiento o nube de puntos.
Una vez realizado el grafico, se
recomienda tener en cuenta los siguientes
aspectos para trazar la línea.

DIAGRAMA DE DISPERSIÓN o Observar cuidadosamente la forma que


toma el conjunto de puntos.
o La línea debe reflejar la mejor posible
Para realizar la línea que unirá tendencia de los puntos en la grafica.
o La línea debe representar al conjunto
varios de esos puntos se tienen de puntos, por lo tanto debe pasar por
dos métodos: el centro de esa nube. La línea debe ser
hasta donde sea posible, la mas
El método grafico (mano alzada), sencilla.
que suele ser muy objetivo y el
resultado depende de la persona
que haga el análisis y el
Analítico.
NOTA: En un diagrama de dispersión, un valor atípico es
un punto que aparece muy lejos de los otros puntos de
datos, de igual manera tiene puntos influyentes, los cuales
son puntos que afectan fuertemente la grafica de la recta
de regresión(valores atípicos alejados horizontalmente).
REGRESIÓN
Originalmente utilizado
por Galton para indicar Existe una
relaciones en la teoría “correlación” entre
de la herencia
dos variables cuando
biológica. Actualmente
los valores de una de
es el método estadístico
desarrollado para
Y ella están
investigar tales relacionados de
relaciones. alguna manera con
los valores de la otra.
CORRELACIÓN LINEAL
TIPOS DE REGRESIÓN LINEAL
En el análisis de
o “Regresión simple”: estudia la regresión se utiliza la
línea recta por su
relación entre 2 variables. simplicidad en el calculo
o “Regresión múltiple”: maneja matemático, además, en
una variable dependiente pero muchos casos de la vida
real nos proporciona
existen cuando menos 2
aproximaciones
variables independientes. suficientes para ser
aceptada.
REGRESIÓN LINEAL
o Relación lineal positiva (a): muestra un tipo
de relación directa donde al aumentar el
valor de la variable independiente aumenta
el valor de la variable independiente.
o Relación lineal negativa (b): en este caso al
aumentar la variable independiente la
variable dependiente disminuye.
o Relación curvilínea (c): un caso de relación
no lineal.
o En el inciso (d) se muestra un diagrama de
dispersión con un relación nula entre las 2
variables.

Figura 1. Diagramas de dispersión con 2 variables. Estadística aplicada a la administración y la


economía. Primera edición. ©2013 Mc Graw Hill.
CORRELACIÓN LINEAL
o Correlación positiva (a): a valores
crecientes de X le corresponden valores
crecientes de Y.
o Correlación negativa (b): a valores
crecientes de X le corresponden valores
decrecientes de Y.
o (c) No se observa un patrón distintivo,
por lo tanto no existe correlación entre
las variables.
o (d) existe un patrón entre las variables
pero este no es lineal.

Figura 2. Diagramas de dispersión correlación entre 2 variables. Estadística. Decimo


primera edición. ©2013 Pearson Educación.
ECUACIÓN DE REGRESIÓN
El análisis de regresión da lugar a una ecuación matemática que nos
permite describir la relación existente entre dos variables. En otras
palabras, obtener una línea ideal (línea de regresión), que nos
describe la relación o dependencia entre 2 variables.

La ecuación de regresión:

Describe algebraicamente la relación entre 2 variables


X y Y, la grafica de la ecuación de regresión se
denomina “recta de regresión” (o recta de mejor ajuste
o recta de mínimos cuadrados)
ECUACIÓN DE REGRESIÓN
VARIABLES DE LA ECUACIÓN DE REGERSIÓN
VARIABLE X VARIABLE Y
Llamada variable explicativa, variable de Llamada variable de respuesta o variable
predicción o variable independiente. dependiente.

En estadística la ecuación típica de una línea recta y = mx + b, se expresa en la forma

Donde es la intersección con el eje Y, y es la pendiente.

NOTA: Una vez que hayamos los términos de la ecuación, podemos evaluar la recta
de regresión estimada, cuya propiedad especial es: la recta de regresión es la que
mejor se ajusta a los puntos muestrales. (El criterio especifico que se utiliza para
determina que recta se ajusta “mejor” a los puntos muestrales es la propiedad de los
mínimos cuadrados)
COEFICIENTE DE
CORRELACIÓN
El coeficiente de correlación lineal r mide la fuerza de relación lineal entre los
valores cuantitativos pareados X y Y en una muestra, también se conoce como
Coeficiente de correlación producto momento de Pearson, en honor a Karl
Pearson (1857 – 1836), quien lo desarrollo originalmente.

PROPIEDADES DE R
1. El valor de r esta siempre entre -1 y 1, inclusive.
2. El valor de r no cambia si todos los valores de cualquiera de las variables se convierten
a una escala diferente.
3. El valor de r no se ve afectado por la elección de X o Y.
4. R mide la fuerza de una relación lineal.
5. R es muy sensible a los valores atípicos, en el sentido de que un solo valor atípico
puede afectar su valor de manera drástica.
COEFICIENTE DE
CORRELACIÓN
Se recomienda ampliamente el uso de un programa de computo para el calculo del
coeficiente de correlación lineal, luego de su calculo la siguiente explicación ayudara al
momento de determinar la correlación de las variables según el resultado.

CLASIFICACIÓN DEL COEFICIENTE DE CORRELACIÓN


o Correlación perfecta, cuando r = 1 r = -1

o Correlación excelente, cuando r es mayor de 0,90 y menor de 1 (-1<r<-0,90)

o Correlación aceptable, cuando r se encuentra entre 0,80 y 0,90 (-0,90<r<-0,80)

o Correlación regular, cuando r se encuentra entre 0,60 y 0,80 (-0,80<r<-0,60)

o Correlación mínima, cuando r se encuentra entre 0,30 y 0,60 (-0,60<r<-0,30)

o No hay correlación para r menor de 0,30 y mayor a 0 (-0,30<r<0)


COEFICIENTE DE
DETERMINACIÓN
El coeficiente de determinación r² se define como la razón de la variación
explicada a la variación total. Este debe ser un valor tal que cumpa con la
condición 0 < r² <1. Cuando el coeficiente de determinación es igual a 1,
decimos que hay una correlación perfecta, ya que los valores observados
son exactamente iguales a los estimados, en este caso la varianza explicada
es igual a la varianza total.
A medida que el coeficiente de determinación disminuye, la recta
representa cada vez menos al conjunto de observaciones (un r² indica que
no hay correlación).

El coeficiente de determinación indica el porcentaje de las variaciones de la variable


dependiente, atribuible a la influencia de la variable independiente.
FORMULAS PARA HALLAR
LOS COEFICIENTES DE
CORRELACION Y
DETERMINACIÓN
COEFICIENTE DE COEFICIENTE DE
CORRELACIÓN DETERMINACIÓN
PREDICCIÓN O ESTIMACIÓN
PUNTUAL
Los símbolos 0, 1 y σ representan parámetros poblacionales,
“auténticos” y desconocidos que deben ser estimados. El modelo, escrito
en términos de las estimaciones muestrales, es:

Donde b0 y b1 son las estimaciones (obtenidas a partir de la muestra) de β0 y


β1 (parámetros poblacionales desconocidos) respectivamente. Por su parte
S2 , varianza muestral de los residuos, estimará la σ2 poblacional.
PREDICCIÓN O ESTIMACIÓN
PUNTUAL
FORMULAS DE LOS
ESTIMADORES
La siguiente tabla relaciona las fórmulas de los estimadores de los coeficientes de regresión. Y, Z , Sy Y Sz
son las medias y desviaciones típicas de la respuesta y el predictor; y Syz , su covarianza.

La fórmula sobre la imprecisión o error estándar del estimador b1, SE(b1) es:
BIBLIOGRAFÍA
o Díaz, A. (2013). Estadística aplicada a la administración y la economía (1st ed.). México: Mc Graw
Hill. Recuperado de:
https://aulavirtual.unimagdalena.edu.co/bbcswebdav/pid-114969-dt-content-rid-807974_1/courses/7
00406-13_FCEM_2020-1/Estca%20aplicada%20adm%C3%B3n%20y%20econom%C3%ADa_D%
C3%ADaz%20Mata_1ra.pdf

o F. Triola, M. (2013). Estadística (11th ed.). México: Pearson Educación. Recuperado de:
https://aulavirtual.unimagdalena.edu.co/bbcswebdav/pid-114968-dt-content-rid-807976_1/courses/7
00406-13_FCEM_2020-1/Estad%C3%ADstica_Triola_11ra.pdf

o Martínez, C. (2012). Estadística y muestreo (13th ed.). Bogotá: Ecoe Ediciones.

o Cortés, J., Bielsa, N., & Cobo, E. (2015). Regresión lineal simple. Recuperado de:
http://www-eio.upc.es/teaching/best/Cap19.pdf

También podría gustarte