Está en la página 1de 12

TEMA5.

TCNICASPARAELESTUDIODELA RELACINENTREVARIABLES(I)

CONCEPTOCORRELACINY CORRELACINDEPEARSON

Anlisisdedatosdelainvestigacineducativa

NDICE

1. Intr oduccin.3 2. Objetivos..3 2.1 Gener ales...3 2.2 Especficos.3 3. Desar r ollodelosdistintosapar tados.4 3.1 Definicin..4 3.2 Condicionesdeaplicacin5 3.3 Pr opiedades...5 3.4 Inter pr etacin...6 4. Actividadesopr oblemas8 5. Solucionesalospr oblemaspr opuestos.8 6. Bibliogr afa12

1. Intr oduccin
Hasta ahora hemos tratado la descripcin de variables por separado, examinado su distribucin y frecuencias, caracterizando y determinando la posicin de individuos en el conjunto de la distribucin. En este trabajo nos ocuparemosdelestudioconjuntodedosvariables,podremosdetectarrelaciones entredosvariables.Lamedidadelasrelacionesentrevariablesseencuentraenla base de un conjunto de mtodos de investigacin a los que dan su nombre los mtodos correlacinales. Por tanto este tema que seguidamente abordaremos se centraenelconceptodecorrelacinyelcoeficientedecorrelacindePearson.

2. Objetivos.

2.1

Gener ales.

Conseguir que los alumnos conozcan el concepto de correlacin y sepan calcularelconceptodecorrelacindePearson.

2.2

Especficos.

LosalumnosdebensabercalcularlacorrelacindePearson. Losalumnosdebenconocerelconceptodecorrelacin.

3.Desar r ollodelosdistintosapar tados 3.1 Definicin


Hablamosdecorrelacincuandonosreferimosalarelacinexistenteentre dosvariables,suintensidadysusentido(positivoonegativo). La covarianza definida anteriormente como promedio de desviaciones conjuntas de dos variables sobre sus respectivas medias, no resulta ser una medida adecuada de la relacin entre dos variables, pues el valor de Sxy esta relacionadoconelvalordela mediadeXyconel valordela mediadeY.por este motivo, si cambiamos la unidad de medida, la covarianza se vera modificada. Podemos afirmar que el valor de la covarianza depende de la unidad de medida.Paraevitarelefectodela unidadde medidasobre Sxy podemosdividir laspuntuacionesdiferencialesporlasrespectivasdesviacionestpicas Sx ySy.El nuevondicederelacinqueobtengamostendrlaventajadeserinvarianteante cualquier cambio en la unidad de medida. A este ndice de correlacin se le denomina coeficiente de correlacin de Pearson o tambin coeficiente de correlacinproductomomento. La formula del coeficiente de correlacin de Pearson tambin suele expresarsedelasiguienteforma,conobjetodeeliminarerroresqueprovengande lapresenciadenmerosdecimalesenelvalorqueadoptalamedia:

3.2Condicionesdeaplicacin
Aplicar el coeficiente de correlacin de Pearson exige que las variables estn medidas al menos en una escala de intervalos y que se de una relacin lineal entre ellas. Es decir, que los puntos del diagrama de dispersin se posicionen en la forma aproximada de una lnea recta. Por tanto, usar el coeficiente de correlacin de Pearson presupone la sospecha de que entre los gruposdepuntuacionessedaunarelacinlineal.

3.3Pr opiedades
a.El coeficiente de correlacin de Pearson se encuentra comprendido entrelosvalores1y1.

b.En el caso de que rxy valga 1, tendr que cumplirse que para cada parejadevalores,suspuntuacionestpicassoniguales: Zx = Zy.Enel poloopuesto,esdecir,sirxyvale1,entoncessecumplequeparatodo par de valores, las puntuaciones tpicas son iguales pero de distinto signo:Zx =Zy. c.En el caso de que variablesmedidas.

rxy es cero es que no hay relacin lineal entre las

d.La transformacin lineal de las variables no modifica el valor del coeficientedecorrelacin,aunquespodracambiarsusigno.Esdecir, si calculamos la correlacin entre las variables x e y, el valor de esta ser, en valor absoluto, el mismo que obtengamos entre la variable ax+b,dondeaybsonconstantes.

3.4Inter pr etacin
AlinterpretarelcoeficientedecorrelacindePearsonnossituaremosenun nivelmeramentedescriptivo. Aligualqueocurraconlacovarianza,lacorrelacinentredosvariableses positivasiambascavaranenelmismosentido,esdecir,cuandoapuntuaciones porencimadela mediaenXcorrespondepuntuacionesporencimadela media enY,yapuntuacionespordebajodelamediaenXcorrespondenpuntuaciones por debajo de la media en Y. por el contrario, la correlacin entre X e Y es negativa, cuando cavaran en sentido opuesto, es decir, a puntuaciones por encimadelamediaenXcorrespondepuntuacionespordebajodelamediaenY, yviceversa. Sitenemosencuentael valorde lacorrelacin,podemosafirmarque, un coeficientedecorrelacindePearsoniguala11,implicaqueeneldiagrama dedispersincorrespondientea las variablesXeYlospuntossedisponena lo

largo de una lnea recta, y por tanto podemos decir que la covariacin entre ambasvariablesestotal. Uncoeficientedecorrelacinigualoprximoaceroindicaquenoexistes relacin lineal entre las dos variables, aunque podra existir otro tipo de correlacinnolineal. Resultadifcilprecisarapartirdequevalorde rxypodemosconsiderarque existe una correlacin lineal entre dos variables. Siempre debemos tener en cuentaparalainterpretacineltipodevariablesalasqueseaplica.Sinembargo, para tener un referente, y siendo conscientes de que estos coeficientes no son aplicablesatodaslassituaciones,tomamoslosdeterminadosporBisquerra:

r=1correlacinperfecta. 08<r<1correlacinmuyalta 06<r<08correlacinalta 04<r<06correlacinmoderada 02<r<04correlacinbaja 0<r<02correlacinmuybaja r=0correlacinnula

Adems debemos tener presente que la existencia de una correlacin no implicaquenecesariamentedebaexistirunarelacincausaldirecta.Porrelacin causaldirectaseentiendequesiXeYestncorrelacionadas,entoncesXesen granpartelacausadeY,oYesenpartelacausadeX. No obstante, es habitual que tras encontrar una elevada correlacin entre variables se hipoteticen relaciones causaefecto. Pero la existencia de una relacindeestetipo habrdesercomprobadarecurriendoaotrasestrategiasde investigacinyaotrastcnicasestadsticas.

4. Actividadesopr oblemas
1) El Equipo Directivo de un Centro de Educacin Secundaria est interesado en conocer la relacin que existe entre el tiempo semanal (horas)que dedican losalumnosalestudioy lascalificaciones medias delos mismosal finaldetrimestre.Eligiendo11alumnosalazar,han encontrado los siguientes resultados. Calcular el coeficiente de correlacindePearson. 2) Para comprobar la fiabilidad de una prueba de razonamiento espacial, unpsicopedagogosedisponeaaplicarlaendosmomentosdistintosaun grupo de 10 sujetos. Si la prueba es fiable se espera que las puntuaciones logradas en ambos casos correlacionen entre s. A partir delosdatosrecogidos,quemostramosacontinuacin,enqumedida podemosafirmarquelapruebaesfiable?

1aplicacin:18141116151219101914 2aplicacin:1715918151118101716

5. Solucionesalospr oblemaspr opuestos.


1)X 5 2 4 7 10 4 8 1 3 6 10 60 Y 7 4 5 8 9 6 9 4 5 7 8 72 XY 35 8 20 56 90 24 72 4 15 42 80 446 x 0.46 3.46 1.46 1.54 4.54 1.46 2.54 4.46 2.46 0.54 4.54 y 0.45 2.55 1.55 1.45 2.45 0.55 2.45 2.55 1.55 0.45 1.45 x y 0.21 8.82 2.26 2.23 11.12 0.80 6.22 11.37 3.81 0.24 6.58 53.24
8

Comosepuedeverenlatablaanteriorsemuestranlosresultadosde x e y que son puntuaciones diferenciales que se han conseguido restndoles las medias a las puntuaciones directas. El valor de la media en cada una de las variables las mostrar a continuacin junto con las operaciones para calcular la covarianzadecadavariable.

Media X=X=60 =5.46Y= Y=72=6.55 n11n11

Covarianza

Sxy=XiYi XY=446 5.456.55=4.79 n 11 Elresultadodelacovarianzaalserpositivo,nosindicaciertatendencia a que a un tiempo semanal de estudio por encima de la media corresponden calificacionesporencimadelamedia,yauntiempodeestudiopordebajodela mediacorresponden calificacionespordebajodelamedia.

Para calcular el coeficiente de correlacin de Pearson nos ayudarn los resultados del ejercicio anterior. Pero adems tendremos que calcular la desviacin tpica de x e y. Y para la desviacin tpica necesitaremos los resultados de la varianza de x e y respectivamente. Mostrar a continuacin el procedimiento y los resultados del proceso necesario para obtener lo solicitado porelproblema.

S x= x fi X =42029.7=8.48 n 11

S y= x fi X =50642.9=3.1 n11 Sx= 8.48=2.91 Sy= 3.1=1.76 CoeficientedecorrelacindePearson rxy= Sxy SxSy

rxy=4.79 =0.94 2.911.76

Viendo los resultados llegamos a la conclusin de que estamos ante una correlacinmuyalta,loquequieredecirapuntuacionesaltasencuantoanotasse correspondenaltashorasdetrabajoyestudiosemanal.

2) X 18 14 11 16 15 12 19 10 19 14 148 Y 17 15 9 18 15 11 18 10 17 16 146 XY 306 210 99 288 225 132 342 100 323 224 2249
2 X 2 Y

324 196 121 256 225 144 361 100 361 196 2284

289 225 81 324 225 121 324 100 289 256 2234

10

N=10

rxy=_________n xy x y__________=____10 2249148 146__=


2 2 2 2 n xi (xi) nyi (yi) 2 2 10 2284148 10 2234146

882____=_____882___=0.90

30.59 32978.88

Viendolosresultados,llegamosalaconclusindequelapruebaesfiable, ya que existe una correlacin muy alta. Como el resultado es positivo las dos variablescorrelacionanenelmismosentido.ApuntuacionesXporencimadela mediaenlaprimeraaplicacin,correspondenvaloresXporencimadela media enlasegundaaplicacin.

11

6. Bibliogr afa
GIL, J. DIEGO, J.L. RODRGUEZ, G. y GARCA, E. (1996). Problemas de Estadstica

BsicaAplicadaalasCienciasdelaEducacin.Sevilla:Kronos.
GIL,J.RODRGUEZ,G.yGARCA,E.(1995).EstadsticaBsicaAplicadaalasCiencias

delaEducacin.Sevilla:Kronos

12

También podría gustarte