Está en la página 1de 10

REPÚBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL P.P. PARA LA EDUCACIÓN SUPERIOR


INSTITUTO UNIVERSITARIO DE TECNOLOGIA INDUSTRIAL
“RODOLFO LOERO ARISMENDI´´
SEDE - LITORAL

Estadística II
(Coeficiente de correlación)

Profesor:
Bachiller:
Méndez Nelson Pérez Yormelin
CI: 19136921
ANÁLISIS DE CORRELACIÓN

EN QUE CONSISTE EL ANALISIS DE CORRELACION

El análisis de correlación consiste es un procedimiento estadístico para determinar si


dos variables están relacionadas o no . el resultado del análisis es un coeficiente de
correlación que puede tomar valores entre -1 y +1. El signo indica el tipo de correlación
entre las dos variables.

Este resultado nos sirve para entender tres cosas

a) Si existe o no correlación entre las dos variables. Un coeficiente que valga cero
nos indica que nuestras variables son independientes.

Por ejemplo, no hay relacion entre que tan dulce es una fruta y cual es el precio
del litro de jugo.

b) Que tan fuerte es la correlación (si es que existe) . a mas se aleje del cero el
coeficiente más fuerte será la correlación entre las dos variables , siendo así, las
correlaciones cuyo coeficiente este mas cerca de -1 o 1 serán más poderosas.

c) Detalles sobre la naturaleza de la correlación . existen correlaciones llamadas


directas donde ambas aumentan o disminuyen al mismo tiempo , e inversas
cuando una aumenta la otra disminuye.

UTILIDAD

el análisis de correlación es un enfoque estadístico que se utiliza para


determinar la relacion que existe entre las variables cuantitativas o categóricas.
Variables cuantitativas: son aquellas que adoptan valores numéricos (es decir,
cifras) . de este modo se diferencian de las variables cualitativas.

Variables cualitativas: son aquellas que permiten la expresión de unas


características , una categoría, un atributo o una cualidad.

variable cualitativa

se dividen en

cualitativas politomicas cualitativas nominales


nominales ordinales

Las variables cualitativas politómicas nominales: son aquellas que adoptan valores
que no se pueden ordenar, ejemplo: un pantalón puede ser : azul, verde amarillo. Rojo,
o rosa, porque citan algunas posibilidades sin tener un criterio o una jerarquía que
permita la ordenación o atributo (el color)

Las variables cualitativas ordinales : son aquellas que adquieren valores que si
pueden ordenarse ( sonido) puede ser débil, moderado e intenso, se ordenan de mayor
a menor o viceversa

En conclusión, el análisis de correlación se utiliza para:

 Verificar Si los datos son consistentes con la hipótesis.


 Predecir una variable sobre la base del conocimiento de otra.
 La construcción de modelos y teorías.
 Agrupar variables / medidas para una interpretación parsimoniosa de los datos
 La relacion de pruebas estadísticas multivalentes.
TIPOS DE CORRELACION

hay tres tipos de correlación:

 directa o positiva : ocurre cuando una variable aumenta y la otra


también.

 Inversa o negativa: se da cuando una


variable aumenta y la otra y la otra
disminuye, la recta corresponde a
una nube de puntos de la distribución .
es una recta decreciente.

 Nula o sin correlación: se da cuando no hay una relacion aparente entre


las variables. En este caso se dice que las variables son
incorrelacionadas y la nube de puntos tienen una forma redondeada.
QUE ES EL COEFICIENTE DE CORRELACIÓN

Es aquel que expresa de manera cuantitativa el grado y la dirección de la relacion entre


dos variables .

Grado de correlación : este indica la proximidad que hay entre dos puntos y se
pueden dar de dos tipos :

Correlación fuerte: la correlación será fuerte cuando más cerca estén los puntos de la
recta.

Correlación débil: será débil cuando más separado estén los puntos de la recta.
MÉTODO DE CALCULO DEL COEFICIENTE DE CORRELACION SIMPLE

El coeficiente de correlación simple se le puede denominar coeficiente de orden


cero y se simboliza por medio de una r con dos subíndices que hacen referencia a las
variables de las que se está hallando. Para calcular el coeficiente de correlación
necesitamos, pues, un parámetro que nos permita cuantificar esta relación. Para ello se
dispone de la covarianza, que indica el grado de variación conjunta de dos variables
aleatorias.

El problema de la covarianza es que su valor depende de las escalas de


medición de las variables, lo que nos impide realizar comparaciones directas entre
distintos pares de variables. Para evitar este problema, recurrimos a una solución que
es conocida y que no es otra que la estandarización El producto de la estandarización
de la covarianza serán los coeficientes de correlación.

El coeficiente de correlación simple está basado en la suposición de la


aproximación a la distribución normal bivariante. Si se tiene más de dos variables, el
modelo básico para la correlación múltiple sería una ampliación de esta distribución,
denominada distribución normal multivariante. Si hay tres variables, habrá tres
correlaciones simples entre ellas. Estos coeficientes miden la relación lineal que existen
entre estas variables, dos a dos, sin tener en cuenta la posible influencia de la tercera.
Las notas de   alumnos de una clase en Matemáticas y Física son las
siguientes:

Matemátic física
a
2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
7 6
8 7
10 9
10 10

1 se añade a la tabla 3 columnas con  ,   y  , respectivamente. El último


renglón de la tabla se obtiene sumando los valores de cada columna:

2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 16
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100

72 60 431 504 380

2 se haya las medias aritméticas.

                    

3Calculamos la covarianza.

4 se calcula las desviaciones típicas.

5 se aplica la fórmula del coeficiente de correlación lineal.

 
 

Al ser el coeficiente de correlación positivo, la correlación es directa.

Como coeficiente de correlación está muy próximo a 1 la correlación es muy


fuerte.

EJEMPLO RESUELTO DE CALCULO DE COEFICIENTE DE CORRELACIÓN


LINEAL

1. calcular los promedios de cada columna , esto se calcula


dividiendo la suma de x entre el número de datos (10) con las
siguientes formulas:

∑ x 560 ∑ y 178
x= = =56 y= = =17.8
n 10 n 10

2. elevar al cuadrado cada una de las restas obtenidas de la


columna (X - ) y (y - ) para obtener los siguientes valores.

3. Multiplicar (X - )( y - ) para obtener los últimos valores.

4. Se suman todos los resultados de las 3 ultimas columnas para


obtener el total de cada una.

y x X- y- (X - )2 (y - )2 (X - )( y - )


3 100 44 -14.8 1936 219.04 -651.2
5 90 34 12.8 1156 163.84 -435.2
9 80 24 -8.8 576 77.44 -211.2
10 45 -11 -7.8 121 60.84 85.8
20 50 -6 2.2 36 4.84 -13.2
21 50 -6 3.2 36 10.24 -19.2
24 60 4 6.2 16 38.44 -24.8
24 40 -16 6.2 258 38.44 -99.2
27 25 -31 9.2 961 84.64 -285.2
35 20 -36 17.2 1296 294.84 -619.2
178 560 6390 993.6 -2223

6) Se obtienen los valores

Σ(X - )2 = 6390 Σ(y - )2 = 993.6 Σ(X - )( y - ) = - 2223

6) se obtiene el coeficiente de correlación con la siguiente formula:

∑ ( x−x ) ( y− y )
r=
√∑ ( x− x ) √∑ ( y − y )
❑ 2

7 ) se sustituyen los valores:

−2223 −2223
r = √6390 √ 993.6 =

( 79.93747 )( 31.52142 )

r =−0.88223 coeficiente de correlación lineal

También podría gustarte