Documentos de Académico
Documentos de Profesional
Documentos de Cultura
S xy
r
nSxS y
forma de la correlación
La relación entre dos súper variables cuantitativas queda representada mediante la línea
de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes
elementales de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el
sentido y la forma
- La fuerza extrema segun el caso, mide el grado en que la línea representa a la nube de
puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que indica
que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la
relación es débil.
- El sentido mide la variación de los valores de B con respecto a A: si al crecer los
valores de A lo hacen los de B, la relación es positiva; si al crecer los valores de A
disminuyen los de B, la relación es negativa
- La forma establece el tipo de línea que define el mejor ajuste: la línea rectal, la curva
monotónica o la curva no monotónica.
Coeficientes de correlación
Finalmente, hay que interpretar las cargas canónicas para determinar la importancia de
cada variable en la función canónica. Las cargas canónicas reflejan la varianza que la
variable observada comparte con el valor teórico canónico.
MEDIDA DE LA CORRELACIÓN
-1 < r < 1
7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre
ambas variables hay dependencia funcional
Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10
Física 1 3 2 4 4 4 6 4 6 7 9 10
xi
xi yi xi2 yi2
·yi
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
2º Calculamos la covarianza.
Y/X 0 2 4
1 2 1 3
2 1 4 2
3 2 5 0
xi · xi2 · yi · yi2 · xi · yi
xi yi fi
fi fi fi fi · fi
0 1 2 0 0 2 2 0
0 2 1 0 0 2 4 0
0 3 2 0 0 6 18 0
2 1 1 2 4 1 1 2
2 2 4 8 16 8 16 16
2 3 5 10 20 15 45 30
4 1 3 12 48 3 3 12
4 2 2 8 32 4 8 16
20 40 120 41 97 76
EJEMPLO 2
CI Horas de TV a la semana
106 7
86 0
100 28
100 50
99 28
103 28
97 20
113 12
113 7
110 17
El primer paso es ordenar los datos de la primera columna. Después, se crean dos
columnas más. Ambas son para ordenar (establecer un lugar en la lista) de las dos
primeras columnas. Después se crea una columna "d" que muestra las diferencias entre
las dos columnas de orden. Finalmente, se crea otra columna "d 2". Esta última es sólo la
columna "d" al cuadrado.
86 0 1 1 0 0
97 20 2 6 4 16
99 28 3 8 5 25
103 28 6 8 2 4
110 17 8 5 3 9
REGRESIÓN
El modelo estadístico lineal relaciona una variable aleatoria con una respuesta y a un
conjunto de variables independientes toma la forma en donde son parámetros
desconocidos que generan la linealidad y es una variable, lo que para la relación lineal
de las se considera variables conocidas. Donde la media para la variable aleatoria es
cero, quedando expresada la esperanza como consideremos a continuación el proceso
que se desarrolla mediante el método de mínimos cuadrados en la obtención de la
ecuación de la mejor línea recta.
Si sabemos que existe una relación entre una variable denominada dependiente y otras
denominadas independientes (como por ejemplo las existentes entre: la experiencia
profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de
personas, la producción agraria y la cantidad de fertilizantes utilizados, etc.), puede
darse el problema de que la dependiente asuma múltiples valores para una combinación
de valores de las independientes. La dependencia a la que hacemos referencia es
relacional matemática y no necesariamente de causalidad. Así, para un mismo número
de unidades producidas, pueden existir niveles de costo, que varían empresa a
empresa.Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresión en
los cuales se obtiene una nueva relación pero de un tipo especial denominado función,
en la cual la variable independiente se asocia con un indicador de tendencia central de la
variable dependiente. Cabe recordar que en términos generales, una función es un tipo
de relación en la cual para cada valor de la variable independiente le corresponde uno y
sólo un valor de la variable dependiente
El método consiste en considerar las mínimas desviaciones que se tienen con respecto a
la mejor aproximación, por lo que pudiéramos considerar las desviaciones que se
generan con respecto al eje de la vertical. Sean las coordenadas las de puntos sobre la
línea de aproximación, o también llamada recta de regresión y sean los puntos de la
muestra a considerar de coordenadas por lo que las desviaciones verticales con respecto
a los puntos las podemos expresar de la forma a las que en ocasiones se les conoce
como error.
Las técnicas de regresión permiten hacer predicciones sobre los valores de cierta
variable Y (dependiente), a partir de los de otra X (independiente), entre las que
intuimos que existe una relación. Para ilustrarlo retomemos los ejemplos mencionados
al principio del capítulo. Si sobre un grupo de personas observamos los valores que
toman las variables
Una línea de tendencia representa una tendencia en una serie de datos obtenidos a través
de un largo periodo de tiempo. Este tipo de líneas puede decirnos si un conjunto de
datos en particular (como por ejemplo, el PBI, el precio del petróleo o el valor de las
acciones) han aumentado o decrementado en un determinado periodo de tiempo.[10] Se
puede dibujar una línea de tendencia a simple vista fácilmente a partir de un grupo de
puntos, pero su posición y pendiente se calcula de manera más precisa utilizando
técnicas estadísticas como las regresiones lineales. Las líneas de tendencia son
generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de mayor
grado dependiendo de la curvatura deseada en la línea.
Rectas de regresión
Las rectas de regresión son las rectas que mejor se ajustan a la nube de puntos (o
también llamado diagrama de dispersión) generada por una distribución binomial.
Matemáticamente, son posibles dos rectas de máximo ajuste
REGRESIÓN SIMPLE
-Como Y depende de X,
-Y es la variable dependiente, y
-X es la variable independiente.
Y = f (X)
"Y está regresando por X"
Y=a+bX+e
- La variable Y es aleatoria
EJEMPLO
Distancia (en km) 0,05 0,1 0,12 0,4 0,5 0,7 1 1,2 2,1 2,5 3 3
Nota media 8,4 4 5,7 9,1 6,3 6,7 4,3 5,4 7,8 4,5 7,2 8,1
Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la
correlación es prácticamente inexistente, es decir, no tiene nada que ver con el
rendimiento académico la distancia del domicilio al instituto
Es evidente que no todos dibujaríamos exactamente la misma recta para una nube de
puntos, aunque la correlación fuera bastante fuerte.De todas las rectas posibles los
matemáticos han elegido como la mejor aproximación la llamada de los mínimos
cuadráticos, Su cálculo es también algo mecánico que podemos hacer con calculadora .
En el siguiente apartado encontrarás un ejercicio para estudiar sus propiedades
INGENIERIA INDUSTRIAL
TRABAJO DE:
ESTADISTICA Y PROBABILIDADES
TEMA:
SEGURIDAD CIUDADANA
PERTENECE A:
NRO: 25
DOCENTE:
SEMESTRE:
TERCERO
AREQUIPA – PERU
2009