Está en la página 1de 9

UNIVERSIDAD TECNICA DE MACHALA FACULTAD DE INGENIERIA CIVIL PROBABILIDAD Y ESTADISTICA

NOMBRE: DANIEL FELIPE CALDERON CURSO: 2 A FECHA: 13 de enero

COEFICIENTE DE CORRELACIN DE SPEARMAN


En estadstica, el coeficiente de correlacin de Spearman, (ro) es una medida de la correlacin (la asociacin o interdependencia) entre dos variables aleatorias continuas. Para calcular , los datos son ordenados y reemplazados por su respectivo orden. El estadstico viene dado por la expresin:

donde D es la diferencia entre los correspondientes valores de x - y. N es el nmero de parejas. Se tiene que considerar la existencia de datos idnticos a la hora de ordenarlos, aunque si stos son pocos, se puede ignorar tal circunstancia Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximacin a la distribucin t de Student

La interpretacin de coeficiente de Spearman es igual que la del coeficiente de correlacin de Pearson. Oscila entre -1 y +1, indicndonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlacin pero no independencia. La tau de Kendall es un coeficiente de correlacin por rangos, inversiones entre dos ordenaciones de una distribucin normal bivariante.

Ejemplo Los datos brutos usados en este ejemplo se ven debajo. CI 106 86 100 100 99 103 97 113 113 110 Horas de TV a la semana 7 0 28 50 28 28 20 12 7 17

El primer paso es ordenar los datos de la primera columna. Despus, se crean dos columnas ms. Ambas son para ordenar (establecer un lugar en la lista) de las dos primeras columnas. Despus se crea una columna "d" que muestra las diferencias entre las dos columnas de orden. Finalmente, se crea otra columna "d2". Esta ltima es slo la columna "d" al cuadrado. Despus de realizar todo esto con los datos del ejemplo, se debera acabar con algo como lo siguiente: CI (i) 86 97 99 100 100 103 106 110 113 113 Horas de TV a la semana (t) 0 20 28 50 28 28 7 17 7 12 orden(i) orden(t) d 1 2 3 4.5 4.5 6 7 8 9.5 9.5 1 6 8 10 8 8 2.5 5 2.5 4 0 4 5 d2 0 16 25

5.5 30.25 3.5 12.25 2 3 7 4 9 49 4.5 20.25

5.5 30.25

Ntese como el nmero de orden de los valores que son idnticos es la media de los nmeros de orden que les corresponderan si no lo fueran. Los valores de la columna d2 pueden ser sumados para averiguar de n es 10. As que esos valores pueden ser sustitudos en la frmula. . El valor

De lo que resulta = 0.187878787879.

COEFICIENTE DE CORRELACIN ESPESO DEL SPEARMAN


En estadstica, Coeficiente de correlacin espeso del Spearman o Rho del Spearman, nombrado despus Spearman de Charles y denotado a menudo por la letra griega (rho) o como rs, es a no paramtrico medida de correlacin que es, determina como de bien un arbitrario monotnico la funcin poda describir la relacin entre dos variables, sin la fabricacin de ningunas asunciones sobre distribucin de frecuencia de variables. Clculo En principio, el es simplemente un caso especial del Coeficiente del producto-momento de Pearson en cul dos sistemas de datos Xi y Yi se convierten a graduaciones xi y yi antes de calcular el coeficiente.[1] En la prctica, sin embargo, un procedimiento ms simple se utiliza normalmente para calcular el . cuentas crudas se convierten a las filas, y a las diferencias di entre las filas de cada observacin respecto a las dos variables se calculan. Si no hay filas atadas, es decir. entonces el se da cerca: donde: di = xi yi = la diferencia entre las filas de valores correspondientes Xi y Yi, y n = el nmero de valores en cada modem (igual para ambos sistemas). Si estn atadas las filas existen, Pearson clsico coeficiente de correlacin entre las filas tiene que ser utilizado en vez de este frmula:[1]

Uno tiene que asignar a la misma fila a cada uno de los valores iguales. Es un promedio de sus posiciones en la orden ascendente de los valores: Un ejemplo de hacer un promedio de filas En la tabla abajo, aviso cmo la fila de los valores que son iguales es el medio de cul estaran sus filas de otra manera. Variable Xi Posicin en la orden descendente Fila xi 0.8 1.2 1.2 2.3 18 5 4 3 2 1 2 1 5

El coeficiente de correlacin espeso del Spearman es equivalente a la correlacin de Pearson en filas. El primer frmula arriba es un atajo a su forma del producto-momento, no si se asume que ningn lazo (es decir. ningunas filas del igual en cualquier columna). El segundo, forma del producto-momento se puede utilizar en casos atados y desatados. Ejemplo La informacin en bruto usada en este ejemplo se demuestra abajo. ndice de inteligencia, Xi Horas de TV por semana, Yi 106 86 100 101 99 103 97 113 112 110 7 0 27 50 28 29 20 12 6 17

El primer paso es clasificar estos datos por la segunda columna. Despus, se crean dos ms columnas (xi y yi). El ltimo de estas columnas (yi) se asigna 1.2.3,n, y entonces los datos son clasificados por la primera columna original (Xi). El primeros de las columnas creadas recientemente (xi) se asigna 1.2.3,n. Entonces una columna di se crea para celebrar las diferencias entre las dos columnas espesas (xi y yi). Finalmente otra columna debe ser creado. sta es columna justa di ajustado. Despus de hacer este proceso con los datos del ejemplo usted debe terminar para arriba con algo como: ndice de inteligencia, Xi Horas de TV por semana, Yi fila xi fila yi di 86 97 99 100 101 103 106 110 112 113 0 20 28 27 50 29 7 17 6 12 1 2 3 4 5 6 7 8 9 10 1 6 8 7 10 9 3 5 2 4 0 0 -4 16 -5 25 -3 9 -5 25 -3 9 4 16 3 9 7 49 6 36

Los valores en la columna se puede ahora agregar al hallazgo . El valor de n es 10. Estos valores se pueden ahora substituir tan nuevamente dentro de la ecuacin, cul evala = 0.175758. En el caso de lazos en los valores originales, este frmula no debe ser utilizado. En lugar, el coeficiente de correlacin de Pearson se debe calcular en las filas (donde los lazos se dan a filas, como se describe anteriormente). Determinacin de la significacin El acercamiento moderno a la prueba si un valor observado del es perceptiblemente diferente a partir de la cero (tendremos siempre 1 1 del del ) es calcular la probabilidad que sera mayor o igual el observado, dada hiptesis nula, usando a prueba de la permutacin. Este acercamiento es casi siempre superior a los mtodos tradicionales, a menos que modem es tan grande que la energa que computa no es suficiente generar

permutaciones, o a menos que un algoritmo para crear las permutaciones que son lgicas bajo hiptesis nula sea difcil de idear para el caso particular (pero generalmente estos algoritmos sea directo). Aunque la prueba de la permutacin es a menudo trivial realizarse para cualquier persona con los recursos que computan y la experiencia de programacin, los mtodos tradicionales para determinar la significacin siguen siendo ampliamente utilizados. El acercamiento ms bsico es comparar el observado con las tablas publicadas para los varios niveles de la significacin. Esto es una solucin simple si la significacin necesita solamente ser sabida dentro de cierta gama o menos que cierto valor, mientras las tablas estn disponibles que especifique las gamas deseadas. Una referencia a tal tabla se da abajo. Sin embargo, la generacin de estas tablas es de cmputo intensiva y los trucos matemticos complicados se han utilizado sobre los aos para generar las tablas para tamaos de muestra ms grandes y ms grandes, as que no es prctico para que la mayora de la gente extienda las tablas existentes. Un acercamiento alternativo disponible para los tamaos de muestra suficientemente grandes es una aproximacin a T-distribucin del estudiante. Para los tamaos de muestra sobre cerca de 20, la variable tiene t-distribucin de un estudiante en el caso nulo (correlacin cero). En el caso no nulo (es decir. para probar si un observado es perceptiblemente diferente de un valor terico, o si dos observaron s para diferenciar perceptiblemente) las pruebas son mucho menos de gran alcance, aunque t- la distribucin puede ser utilizada otra vez. Una generalizacin del coeficiente del Spearman es til en la situacin donde hay tres o ms condiciones, un nmero de temas todos se observa en cada uno de ellos, y predecimos que las observaciones tendrn una orden particular. Por ejemplo, un nmero de temas se pudieron cada uno dar tres ensayos en la misma tarea, y predecimos que el funcionamiento mejorar de ensayo al ensayo. Una prueba de la significacin de la tendencia entre las condiciones en esta situacin fue desarrollada por el E. B. Pagine y se refiere generalmente como Prueba de la tendencia de la pgina para los alternativas pedidos.

Anlisis de la correspondencia basado en rho del Spearman


Clsico anlisis de la correspondencia es un mtodo estadstico que da una cuenta a cada valor de dos variables nominales, de esta manera que Pearson coeficiente de correlacin entre ellos se maximiza. Existe un equivalente de este mtodo, llamado el anlisis de la correspondencia del grado, que maximiza rho del Spearman o Tau de Kendall[2].

Coeficiente de correlacin de los rangos de Spearman


Este coeficiente es una medida de asociacin lineal que utiliza los rangos, nmeros de orden, de cada grupo de sujetos y compara dichos rangos. Existen dos mtodos para calcular el coeficiente de correlacin de los rangos uno sealado por Spearman y otro por Kendall 8. El r de Spearman llamado tambin rho de Spearman es ms fcil de calcular que el de Kendall. El coeficiente de correlacin de Spearman es exactamente el mismo que el coeficiente de correlacin de Pearson calculado sobre el rango de observaciones. En definitiva la correlacin estimada entre X e Y se halla calculado el coeficiente de correlacin de Pearson para el conjunto de rangos apareados. El coeficiente de correlacin de Spearman es recomendable utilizarlo cuando los datos presentan valores externos ya que dichos valores afectan mucho el coeficiente de correlacin de Pearson, o ante distribuciones no normales. El clculo del coeficiente viene dado por

en donde di = rxi ryi es la diferencia entre los rangos de X e Y. Los valores de los rangos se colocan segn el orden numrico de los datos de la variable. Ejemplo: Se realiza un estudio para determinar la asociacin entre la concentracin de nicotina en sangre de un individuo y el contenido en nicotina de un cigarrillo (los valores de los rangos estn entre parntesis) 2.

X Concentracin de Nicotina en sangre (nmol/litro) 185.7 (2) 197.3 (5) 204.2 (8) 199.9 (7) 199.1 (6) 192.8 (6) 207.4 (9) 183.0 (1) 234.1 (10) 196.5 (4)

Y Contenido de Nicotina por cigarrillo (mg) 1.51 (8) 0.96 (3) 1.21 (6) 1.66 (10) 1.11 (4) 0.84 (2) 1.14 (5) 1.28 (7) 1.53 (9) 0.76 (1)

Si existiesen valores coincidentes se pondra el promedio de los rangos que hubiesen sido asignado si no hubiese coincidencias. Por ejemplo si en una de las variables X tenemos:

X (edad) 23 23 27 27 39 41 45 ...

(Los rangos seran) 1.5 1.5 3.5 3.5 5 6 7 ...

Para el clculo del ejemplo anterior de nicotina 2 obtendramos el siguiente resultado:

Si utilizamos la frmula para calcular el coeficiente de correlacin de Pearson de los rangos obtendramos el mismo resultado

La interpretacin del coeficiente rs de Spearman es similar a la Pearson. Valores prximos a 1 indican una correlacin fuerte y positiva. Valores prximos a 1 indican una correlacin fuerte y negativa. Valores prximos a cero indican que no hay correlacin lineal. As mismo el tiene el mismo significado que el coeficiente de determinacin de r2.

La distribucin de rs es similar a la r por tanto el calculo de los intervalos de confianza de rs se pueden realizar utilizando la misma metodologa explicada para el coeficiente de correlacin de Pearson.

También podría gustarte