Documentos de Académico
Documentos de Profesional
Documentos de Cultura
donde D es la diferencia entre los correspondientes valores de x - y. N es el nmero de parejas. Se tiene que considerar la existencia de datos idnticos a la hora de ordenarlos, aunque si stos son pocos, se puede ignorar tal circunstancia Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximacin a la distribucin t de Student
La interpretacin de coeficiente de Spearman es igual que la del coeficiente de correlacin de Pearson. Oscila entre -1 y +1, indicndonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlacin pero no independencia. La tau de Kendall es un coeficiente de correlacin por rangos, inversiones entre dos ordenaciones de una distribucin normal bivariante.
Ejemplo Los datos brutos usados en este ejemplo se ven debajo. CI 106 86 100 100 99 103 97 113 113 110 Horas de TV a la semana 7 0 28 50 28 28 20 12 7 17
El primer paso es ordenar los datos de la primera columna. Despus, se crean dos columnas ms. Ambas son para ordenar (establecer un lugar en la lista) de las dos primeras columnas. Despus se crea una columna "d" que muestra las diferencias entre las dos columnas de orden. Finalmente, se crea otra columna "d2". Esta ltima es slo la columna "d" al cuadrado. Despus de realizar todo esto con los datos del ejemplo, se debera acabar con algo como lo siguiente: CI (i) 86 97 99 100 100 103 106 110 113 113 Horas de TV a la semana (t) 0 20 28 50 28 28 7 17 7 12 orden(i) orden(t) d 1 2 3 4.5 4.5 6 7 8 9.5 9.5 1 6 8 10 8 8 2.5 5 2.5 4 0 4 5 d2 0 16 25
5.5 30.25
Ntese como el nmero de orden de los valores que son idnticos es la media de los nmeros de orden que les corresponderan si no lo fueran. Los valores de la columna d2 pueden ser sumados para averiguar de n es 10. As que esos valores pueden ser sustitudos en la frmula. . El valor
Uno tiene que asignar a la misma fila a cada uno de los valores iguales. Es un promedio de sus posiciones en la orden ascendente de los valores: Un ejemplo de hacer un promedio de filas En la tabla abajo, aviso cmo la fila de los valores que son iguales es el medio de cul estaran sus filas de otra manera. Variable Xi Posicin en la orden descendente Fila xi 0.8 1.2 1.2 2.3 18 5 4 3 2 1 2 1 5
El coeficiente de correlacin espeso del Spearman es equivalente a la correlacin de Pearson en filas. El primer frmula arriba es un atajo a su forma del producto-momento, no si se asume que ningn lazo (es decir. ningunas filas del igual en cualquier columna). El segundo, forma del producto-momento se puede utilizar en casos atados y desatados. Ejemplo La informacin en bruto usada en este ejemplo se demuestra abajo. ndice de inteligencia, Xi Horas de TV por semana, Yi 106 86 100 101 99 103 97 113 112 110 7 0 27 50 28 29 20 12 6 17
El primer paso es clasificar estos datos por la segunda columna. Despus, se crean dos ms columnas (xi y yi). El ltimo de estas columnas (yi) se asigna 1.2.3,n, y entonces los datos son clasificados por la primera columna original (Xi). El primeros de las columnas creadas recientemente (xi) se asigna 1.2.3,n. Entonces una columna di se crea para celebrar las diferencias entre las dos columnas espesas (xi y yi). Finalmente otra columna debe ser creado. sta es columna justa di ajustado. Despus de hacer este proceso con los datos del ejemplo usted debe terminar para arriba con algo como: ndice de inteligencia, Xi Horas de TV por semana, Yi fila xi fila yi di 86 97 99 100 101 103 106 110 112 113 0 20 28 27 50 29 7 17 6 12 1 2 3 4 5 6 7 8 9 10 1 6 8 7 10 9 3 5 2 4 0 0 -4 16 -5 25 -3 9 -5 25 -3 9 4 16 3 9 7 49 6 36
Los valores en la columna se puede ahora agregar al hallazgo . El valor de n es 10. Estos valores se pueden ahora substituir tan nuevamente dentro de la ecuacin, cul evala = 0.175758. En el caso de lazos en los valores originales, este frmula no debe ser utilizado. En lugar, el coeficiente de correlacin de Pearson se debe calcular en las filas (donde los lazos se dan a filas, como se describe anteriormente). Determinacin de la significacin El acercamiento moderno a la prueba si un valor observado del es perceptiblemente diferente a partir de la cero (tendremos siempre 1 1 del del ) es calcular la probabilidad que sera mayor o igual el observado, dada hiptesis nula, usando a prueba de la permutacin. Este acercamiento es casi siempre superior a los mtodos tradicionales, a menos que modem es tan grande que la energa que computa no es suficiente generar
permutaciones, o a menos que un algoritmo para crear las permutaciones que son lgicas bajo hiptesis nula sea difcil de idear para el caso particular (pero generalmente estos algoritmos sea directo). Aunque la prueba de la permutacin es a menudo trivial realizarse para cualquier persona con los recursos que computan y la experiencia de programacin, los mtodos tradicionales para determinar la significacin siguen siendo ampliamente utilizados. El acercamiento ms bsico es comparar el observado con las tablas publicadas para los varios niveles de la significacin. Esto es una solucin simple si la significacin necesita solamente ser sabida dentro de cierta gama o menos que cierto valor, mientras las tablas estn disponibles que especifique las gamas deseadas. Una referencia a tal tabla se da abajo. Sin embargo, la generacin de estas tablas es de cmputo intensiva y los trucos matemticos complicados se han utilizado sobre los aos para generar las tablas para tamaos de muestra ms grandes y ms grandes, as que no es prctico para que la mayora de la gente extienda las tablas existentes. Un acercamiento alternativo disponible para los tamaos de muestra suficientemente grandes es una aproximacin a T-distribucin del estudiante. Para los tamaos de muestra sobre cerca de 20, la variable tiene t-distribucin de un estudiante en el caso nulo (correlacin cero). En el caso no nulo (es decir. para probar si un observado es perceptiblemente diferente de un valor terico, o si dos observaron s para diferenciar perceptiblemente) las pruebas son mucho menos de gran alcance, aunque t- la distribucin puede ser utilizada otra vez. Una generalizacin del coeficiente del Spearman es til en la situacin donde hay tres o ms condiciones, un nmero de temas todos se observa en cada uno de ellos, y predecimos que las observaciones tendrn una orden particular. Por ejemplo, un nmero de temas se pudieron cada uno dar tres ensayos en la misma tarea, y predecimos que el funcionamiento mejorar de ensayo al ensayo. Una prueba de la significacin de la tendencia entre las condiciones en esta situacin fue desarrollada por el E. B. Pagine y se refiere generalmente como Prueba de la tendencia de la pgina para los alternativas pedidos.
en donde di = rxi ryi es la diferencia entre los rangos de X e Y. Los valores de los rangos se colocan segn el orden numrico de los datos de la variable. Ejemplo: Se realiza un estudio para determinar la asociacin entre la concentracin de nicotina en sangre de un individuo y el contenido en nicotina de un cigarrillo (los valores de los rangos estn entre parntesis) 2.
X Concentracin de Nicotina en sangre (nmol/litro) 185.7 (2) 197.3 (5) 204.2 (8) 199.9 (7) 199.1 (6) 192.8 (6) 207.4 (9) 183.0 (1) 234.1 (10) 196.5 (4)
Y Contenido de Nicotina por cigarrillo (mg) 1.51 (8) 0.96 (3) 1.21 (6) 1.66 (10) 1.11 (4) 0.84 (2) 1.14 (5) 1.28 (7) 1.53 (9) 0.76 (1)
Si existiesen valores coincidentes se pondra el promedio de los rangos que hubiesen sido asignado si no hubiese coincidencias. Por ejemplo si en una de las variables X tenemos:
X (edad) 23 23 27 27 39 41 45 ...
Si utilizamos la frmula para calcular el coeficiente de correlacin de Pearson de los rangos obtendramos el mismo resultado
La interpretacin del coeficiente rs de Spearman es similar a la Pearson. Valores prximos a 1 indican una correlacin fuerte y positiva. Valores prximos a 1 indican una correlacin fuerte y negativa. Valores prximos a cero indican que no hay correlacin lineal. As mismo el tiene el mismo significado que el coeficiente de determinacin de r2.
La distribucin de rs es similar a la r por tanto el calculo de los intervalos de confianza de rs se pueden realizar utilizando la misma metodologa explicada para el coeficiente de correlacin de Pearson.