Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONFRONTACION DE VARIABLES
MEDIANTE LA REGRESION Y
CORRELACION
Alumnos:
Docente:
María Gómez
Ilene Malthiesen
C.I.: 26815225
Stephany Velázquez
C.I.: 27421210
Helianis Blanco
C.I.: 27076461
Muchas veces las decisiones se basan en la relación entre dos o más variables.
Ejemplos:
• La relación entre la radiación que reciben los sensores con la que se predicen los
rendimientos por parcelas con los rendimientos reales observados en dichas parcelas.
Un número índice puede definirse como una medida estadística que nos permite
valorar la variación relativa de una magnitud simple o compleja a lo largo del tiempo o
del espacio. Lo más habitual es que se estudie la evolución de la magnitud a lo largo del
tiempo, con lo que hay que establecer un período inicial o base sobre el que se va
comparando la evolución de la magnitud o variable estadística.
Usos
• Para construir un índice de precios agregados sin ponderar, primero debemos obtener
la suma de los diversos precios para cada uno de los periodos que se consideran y luego
dividirla por la suma de los precios del periodo base.
• Sea Σ p0 la suma de los precios del periodo base y sea Σpn la suma de los precios del
periodo dado; el cociente de las dos sumas multiplicado por 100 arroja el índice P
expresado en porcentaje; esto es:
Cuando se utilizan números índices es frecuente que una vez trascurrido cierto tiempo
desde la elección del periodo base, el dato correspondiente a dicho período pierda su
carácter representativo, de manera que resulta conveniente fijar un nuevo período de
referencia más próximo al actual. Para efectuar un cambio de base simplemente se
divide cada valor de la serie de números índices entre el que toma en el que se va a
considerar como nuevo período de referencia. El periodo base debe ser elegido entre los
períodos que tengan un comportamiento lo más normal posible.
Por ejemplo, en el siguiente cuadro se muestra que se ha obtenido los índices en base
1995 para los turistas que llegaron a España por carretera en el periodo comprendido
entre 1995 y 2003. Dado el tiempo transcurrido entre el periodo de referencia y el
actual, puede ser aconsejable realizar un cambio de base de 1995 a 2000. Para obtener
los índices en base 2000 a partir de los que están en base 1995, se divide cada uno de los
valores de la serie en base 1995 entre 118,06 que es el valor que en dicha serie
corresponde al nuevo periodo de referencia, de manera que en el año 1995, el índice en
base 2000 es 84,70 (= 100,00 / 119,06), en el año 1996 es 87,72 (= 103,68 / 118,06),
etcétera.
a) Regresión
b) Correlación
Variable dependiente
Se representa en el eje Y
Variable independiente
Se representa en el eje X
Diagrama de dispersión
Es aquella que puede representarse con mejor exactitud mediante una línea recta. No
toda relación entre dos variables es lineal. Algunas se representan con mejor exactitud
usando una curva. En este caso, se dice que la relación entre las variables es curvilínea.
Una relación entre dos variables puede ser:
Positiva
Negativa
Una relación positiva entre las variables X y Y indica que existe una relación directa
entre ellas, es decir, los valores menores de X están asociados con los valores menores
de Y y los valores mayores de X están asociados con los valores mayores de Y.
Existe una relación positiva entre las variables X y Y si al aumentar los valores de X
los valores de Y tienden a aumentar. Una relación lineal positiva está representada
gráficamente por una línea recta de pendiente positiva
Una relación negativa entre las variables X y Y indica que existe una relación
inversa entre ellas, es decir, los valores menores de X están asociados con los
valores mayores de Y y los valores mayores de X están asociados con los valores
menores de Y. Si existe una relación negativa entre las variables X y Y, entonces al
aumentar los valores de X los valores de Y tienden a disminuir y viceversa.
Una relación lineal negativa queda representada gráficamente por una línea recta
de pendiente negativa.
Relación lineal perfecta
Es aquella en la que existe una relación positiva o negativa para la cual todos los
puntos caen sobre una recta.
Una relación lineal imperfecta es aquella en la cual existe una relación positiva o
negativa, pero no todos los puntos caen sobre la recta.
•Coeficiente de correlación r de Pearson (rxy): se usa cuando los datos están medidos en
una escala de intervalo o de razón.
Si r = 0 - Nula
Si r > 0 y r < ± 0,10 - Casi Nula
Si r >= ± 0,10 y r < ± 0,20 - Muy baja
Si r >= ± 0,20 y r < ± 0,40 - Baja
Si r >= ± 0,40 y r < ± 0,60 - Media
Si r >= ± 0,60 y r < ± 0,80 - Alta
Si r >= ± 0,80 y r < ± 1,00 - Muy alta
Si r = ± 1 – Perfecta
•Linealidad: Para usar de una manera eficiente el análisis de regresión con la finalidad
de predecir, se exige que la relación entre las variables sea lineal.
•Si se va a utilizar los datos de un grupo de sujetos para hacer predicciones sobre otro
grupo de sujetos, es importante que el grupo de cálculo básico sea representativo del
grupo de predicción.
Aplicación
Procedimiento:
1er Paso: Reúna pares de datos (X,Y), cuya relación desea estudiar y organice la
información en una tabla.
2do Paso: Encuentre los valores mínimos y máximos para X e Y. Elija las escalas
que se usarán en los ejes horizontal y vertical, de manera que ambas longitudes sean
aproximadamente iguales, facilitando la lectura del diagrama.
3er Paso: Registre los datos en el gráfico. Cuando se obtengan los mismos valores en
diferentes observaciones, muestre estos puntos haciendo círculos concéntricos (o), o
registre el segundo punto muy cerca del primero.
4to Paso: Agregue toda la información que puede ser de utilidad para entender el
diagrama, tal como: título del diagrama, período de tiempo, número de pares de datos,
nombre de la variable y unidades de cada eje, entre otros.