Está en la página 1de 37
btenaa el valor del coeficiente Capitulo 4 Analisis de asociacién no paramétrico OBJETIVoS INTRODUCCION 4,1 COEFICIENTE DE SPEARMAN (/,) 4.1.1 Interpretacién de los resultados 4.1.2 Prueba de significancia (0 validez) de r, 4.2 COEFICIENTE "TAU" (2) DE KENDALL 4.3 COEFICIENTE DE CORRELACION (fm) BISERIAL DE PUNTO 4.3.1 Prueba de significancia y validez de ry 4.4 COEFICIENTE DE CORRELACION ¢ ifi), PARA UN DISENO 2 x 2 4.4.1 Prueba de significancia de & 4.4.2 Requisitos de uso de & 4.4.3 Coeficiente de contingencia (C) 4.4.4 Prueba de significancia 4.5 COEFICIENTE V DE CRAMER 4.51 Prueba de significancia de V 4.6 COEFICIENTE DE CONCORDANGIA, «, DE KENDALL 4.6.1 Prueba de significancia de w RESUMEN PROBLEMAS. OBJETIVOS ‘Al concluir el estudio de este capitulo, el estudiante estara en condiciones de conocer y emplear el andlisis de asociacion no paramétrico y las pruebas de validez para resolver problemas, aplicando las técnicas de andlisis respectivas, referentes a las ciencias de! ‘comportamiento. Asimismo, estaré en condiciones de: « Definir, identificar sus caracteristicas y calcular coeficientes de Spearman, rz, de Ken- dall, 1; biserial de punto, rs fi [2 x 2), #; de contingencia (n x m), C; de Cramer in x mi, V; de concordancia, w, ‘« Explicar sus diferencias y decir en qué consiste su pruebe de validez. ‘* Expresar los requisitos de las pruebas de validez y su respectivo coeficiente de corre: lacion. ‘= Solucionar ejercicios de aplicaci6n de los coeticientes mencionados, realizando la prueba de validez especifica para cada uno ‘ Identificar mediante e! céleulo las diferencias entre estadistica paramétrica y estadistica no paramétrica, y expresar tales diferencias basicas. INTRODUCCION Los términos con que se denotan los métodos estadisticos no paramétricos suelen ser tales como “distribucion libre”, “‘pruebas de rango” o “pruebas de orden", que no necesa- riamente signfican lo mismo. En cirtas condiciones tales términos ser empleados in- distintamente, aun considerando la afirmacién de Bradley (1968) “acerca de que una prueba no paramétrica es aquella que no formula hipétesis alguna acerca del valor de un pardmetro en una funcion estadistca, en tanto que una prueba de distribucion libre es la ue no hace ninguna suposicion acerca de la forma precisa como se distribuye la pobla- ion”, Las verdaderas caracteristicas que hacen diferentes estos términos estin fuera de nuestro objetivo y, por Io tanto, consideraremos a los métodos stadisticos no paramétricos ‘como aquellos que no requieren conocimientos de ningin parametro de la poblacién. Existen situ variables que intervienen no necesariamente son variables intervalares; en algunos caso: pueden ser variables nominales, de razén, o bien, variables ordinales. ¥ en el caso de exis- tir asociacion lineal entre las variables dependientes e independientes, pero del tipo men- cionado con anterioridad, no resulta conveniente aplicar el coeficiente de correlacion li- neal de Pearson, discutido en el capitulo anterior, ya que las condiciones de este tipo de problemas, en los que no existen parimetros poblacionales, no cumplen las condiciones y requisites de uso que requiere en este caso el citado coeficiente, Pero cuando esto ocurre se pod utilizar el coeficiente de correlacién de Spearman (,), el cual es un caso particu- lar del coeficiente de Pearson (,) 4.1 COEFICIENTE DE SPEARMAN (.) Este coeficiente de correlacion, que también es conocido como “‘coeficiente de rangos or- denados", es uno de los de uso mas frecuente. Es especialmente itil en caso de ser pe- uefio (menor que 30) el naimero de pares de puntajes (n) que se desea asociar. Cuando el nlimero de dichos pares es muy grande (si n ¢s tambien lo bastante grande) por el teorema central del limite, la condici6n de normalidad se minimiza, y el modelo que se emplea es uno parametrico, ‘Tambien, cuando los puntajes se jerarquizan (0 se ponen en corresponden biunivoca con el conjunto de nimeros ordinales), se preven muchos “‘empates”, esto ¢s, que en el ordenamiento varios puntajes tendran el mismo mitmero ordinal. Si estas dos si tuaciones ocurrieran, lo més conveniente es utilizar el coeficiente de correlacion de Pear- ‘son, que como se recordara es: n{dxy] ~ (ExX(Ey) Vd — Exim) - GF yes en algunos problemas en ciencias del comportamiento en que las _ 108 Unidad Uno MODELOS DETERMINISTICOS Pero si el numero de puntajes que se desea correlacionar fuera n < 30, ylos empates son pocos, como estas variables que representan ciertas observaciones pueden ser ordena- das, y al mismo tiempo es deseable comprobar la hipétesis de independencia entre estas dos variables aleatorias, entonces el coeficiente de Spearman es el mas adecuado a utilizar. Debido a que este coeficiente es un caso particular del de Pearson, se define en la siguiente forma: 65 Re) - ROI fina n(n? — 1) obien, 6T mo 1) donde: " T = Eire) — ROP n = Tamafo de muestra R(x) = Variables x jerarquizadas (ordenadas). Ry) = Variables y jerarquizadas (ordenadas). 1y 6 = Constantes numéricas. Ademas de obtener ef grado de asociacién entre dos variables con r,, se puede saber acerca de la dependencia o independencia de dos variables aleatorias, ara la prueba de independencia wtilizando r, existen tres casos, a saber: 1) Prueba bilateral, He: Las x,y las y,son mutuamente independientes. H,: a) Cuando existe la tendencia de que los valores altos de x sean pareados con los valores altos de y. 'b) Cuando existe a tendencia de que los valores bajos (0 pequefios) de x sean pareados con los valores altos (0 grandes) de y SiH, no se rechaza, tanto para a) como b), x ¥ y son dependientes, 2) Prueba unilateral, correlacién positiva. ‘Hg: Las-x y las y, son mutuamente independientes. H,: Cuando existe la tendencia de que los valores altos (0 grandes) de x y de y sean pareados al mismo tiempo. Entonces x y x son dependientes. 3) Prueba unilateral, correlacién negativa. Ho; Las x;y las y, son mutuamente independientes. Capitulo 4/ Andis de asocicién no paramétrco 108 H; Cuando existe la tendencia de que los valores pequefios 0 bajos dex sean pare- ‘ados con los valores altos o grandes de y, también se prevé el caso inverso. Se consideran x y y dependientes. No obstante que la hipétesis nula de ‘‘no correlacién entre x y »”” es mas precisa que ‘el concepto de independencia entre x y y mencionado anteriormente y que implica la exis- tencia, como indican las hipdtesis alternas, de correlacion entre x y y, en este texto se usa~ +4 el concepto de independencia debido a que es mas facil de interpretar y tiene un uso més amplio. Ejemplo A un grupode 10 estudiantes de una escuela superior se le aplicd una prueba de conoci ‘mientos de matemiticas (x) y una prueba de ldgica (y), y se obtuvieron los siguientes puntajes: Estudiane x » A a Pa B 15 2» o 93 43 D yo 32 E 15 40 F 80 36 G 8 38 H 7 37 1 8 50 J 0 46 SCaiencgn mis at, ‘cates mis tla 1) Se desea saber el grado de semejanza entre las calificaciones obtenidas por los estudiantes en las pruebas x y 9. 'b) Hs: Las calificaciones obtenidas en mateméticas son mutuamente independientes de ls cali- ficaciones obtenidas en logica por los 10 estudiantes, contra laalternativa bilateral (dos colas), al 0.05 de nivel de significancia. Hj: Existe una correlacion positiva o negativa entre las calificaciones obtenidas en ambas pruebas (dependencia), ‘Soluci6n para a) Paso 1 Se ubican las calificaciones mas altas y las mas bajas para cada variable. En el caso de la variable x, el estudiante C tiene Ia calificacion mis alta, por lo cual le corresponde el lugar 1. En ‘cambio el estudiante D obtuvo la calificacion mis baja, por lo que le corresponde el lugar 10. Para la variable y, el estudiante A tiene a caificacion més alta, correspondiéndole el lugar 1; coincidentemente, el mismo estudiante D tiene a ealificacin més baja, por lo que le corresponde el mismo lugar 10. M10 Unidad Uno/ MODELOS DETERMINIsTICOS ‘Paso 2 Se obtienen y se ubican los puntajes jerarquizados (ordenados): Estudiante — Rex) Estudiante R(y) ¥ a0, 1 10 ae semommuoeDr Paso 3. Se consideran los puntajes que obtuvieron el mismo orden al ser jerarquizados (0 sea, os puniajes empatados) y se establecen sus verdaderos lugares promediando ios puntajes con empate Por ejemplo, los puntajes de los estudiantes A eT en la variable x, son ambos 84, y los estudiantes B, E yH tienen el mismo puntaje de 75, Por lo anterior, al promesiar los puntajesiguales, pero ya je- ‘arquizados, se puede determinar su lugar exacto. A los estudiantes A ¢ Iles corresponden los lugares 34 (en forma indistinta a A 0 1. gi 7) 2 2 3.5 (orden verdadero) [Lo mismo ocurre para los estudiantes B, E y H, tte — = 8 (Puntaje ordenado verdadero) Paso 4 Se calcula Ten la forma siguiente: Se restan los puntajes jerarquizados para cada estudian- te; posteriormente se elevan al cuadrado cada una de las restas se obtiene la suma total: T= 2 ira) - ROP Esmudiante Ro) RO) ~ RY) A 35 10 25 B 80 60 20 © 10 3.0 -20 D 10.0 10.0 00 E 80 5.0 30 F 60 9.0 -30 G 5.0 10 -20 H 80 80 00 I 35 20 Ls J 20 40 -20 ; (REx) — RDI. T = «2.50 Capitulo 4/ Andie de seociaeon no paremévico ANT Paso 5 Los resultados anteriores se sustituyen en la ecuacion, 67 at = 1) yasi 1-6 142.50) To100 = 1) Sea = 1-285 = 10.26 n= 0.78 ‘Soluci6n para b) ‘A fin de comprobar la hipdtesis propuesta anteriormente acerca de la independencia o dependencia entze as calificaciones obtenidas por los estudiantes de este ejemplo, lo haremos al 0,05 de nivel de significaneia y dos colas. Existen dos formas de evar a cabo lo anterior. Paso 1 Conél valor calculadode T = 42.50 la Tabla 16 del Apéndice se aplicar la prueba de Ho- telling y Pabst, la cual enfatiza la naturaleza no paramétrica de r,. ‘Como el nivel de significancia « = 0,05 y la prueba es de dos colas, entonces a = 0.025 (la mi- tad de 0.05), al buscar el ‘cuantil” de T = 42.80 para n = 10 y a = 0.025, en Ia Tabla 16, r= ns = 60 Puesto que 42.50 e menor que 60, la hiatessnula se rechae. Paso 2 Como r, ya ha sido calculado (r, = 0.74) sera més facil usarlo para comprobar la hipotesis, propuesta; para esto 10.025 = 0,975, que en a Tabla 17 del Apéndice corresponde 0.6364, v de- bido a que la regla de decision nos indica que sir, € mayor que el cuantil dado por la Tabla 17, ia hi- poitesis mula se rechazard ‘Como se podré ver ambos resultados son congrventes, lo que da un poco mis de confiabilidad en las conclusiones. 4.1.1. Interpretacién de los resultados Dado que el coeficiente de correlacion de Spearman es un caso particular del coeficiente de correlacion lineal de Pearson, para fines pritcticos r, puede interpretarse como ry, aun- que en el caso de existir muchos empates en los datos ordenados, habra discrepancia entre 7.9 Tq En el caso del ejemplo que se ha desarrollado, el resultado de r, = 0.74 indica una correlacion significativa. 4.1.2 Prueba de significancia (0 validez) de r, ‘Cuando el tamafio de muestra n es menor que 10, se consultard una Tabla especial 6 del Apén- dice. Esto es debido a que cuando n es pequefia el valor de r, debe ser muy grande para que sea significativo. V12__Unided Uno/ MODELOS DETERMINISTICOS En el caso den > 10, se podré utilizar la siguiente fSrmula (igual que en el caso del coeficiente de Pearson): ‘Sustituyendo Ios valores anteriores se obtiene: 0.74 V0 =2 Contrastando este resultado con la Tabla 3 del Apéndice de la razén 1 de Student, se le- gaa la siguiente conclusién: gi =a-2= 10-2 a = 0.05 Para una prueba bilateral laf critica sera: f (0.05) = 2.36 Por lo que 7, €s significativo, ya que la regla de decision es: Si f > fa, entonces Hy se rechaza, y como 3.11 > 2.36, la hip6tesis nula (#7) también se rechazaré, Se tiene que ¥ @ significa la correlacion no paramétrica en la poblacién. 4.2 COEFICIENTE “TAU” (7) DE KENDALL Esta medida de correlaciOn esta basada en intervalos jerarquizados de las observaciones, ‘mis que en los ntimeros mismos, con la ventaja de que la distribucién de dicho coeficiente no depende de la distribucion de x y y; siempre y cuando las observaciones representadas, por x yy sean independientes y continuas. Este coeficiente, desarrollado por Kendall (1938), ¢s preferido por algunos investigadores sobre el coeficiente de Spearman, no obs- tante que (7) es ligeramente mas dificil de calcular que (r,), en especial cuando existen em- pates, No obstante esto, la ventaja principal de Kendall es que su distribucion tiende a la Copitulo 4/ Analisis de asociacén ro paramétrco 113 distribuci6n normal més répidamente que la de Spearman, Por lo que este “‘ajuste”” alo normal es mejor para el (2) de Kendall que para el (7) de Spearman, siempre y cuendo la hiip6tesis nula (H,) de independencia entre x yy sea cierta. jemplo _Considerando una situacion de indisciplina en el grupo de nifios de cinco aftos de edad en luna guarderia, a nueve niftos (que aparentemente eran los catalogados mas agresivos tanto por sus padres como por la persona encargada de ellos en la guarderia) sles aplico una prueba para confir- mar el grado de agresividad. Por una semana se hicieron registros observacionales, dia a dia y bajo ciertas condiciones, por lo que los registros obtenidos en promedio fueron los siguientes: (RO,),re- sistros observacionales en la guarderia; (RO,), registros observacionales en sus hogares; (Rx), rangos © ntervalos en x (hogar); (R)), rangos o intervalos en y (guarderia). Nios CCaleular el coefciente de correlacion (r) de Kendall, entre lo detectado por sus padres y To de- tectado en la guarderia. ‘ Paso 1 Cada distribucion de puntajes, que representa a cada variable x oy, se jerarquiza de la mis- ‘ma manera que cuando se calcula el coeficiente de Spearman para obtener Rx y Ry, pero con la mo- dificacion de que un conjunto de rangos (x 0) debe estar ordenado en una secuencia natural y cre ciente, El objetivo de este paso es tener una referencia que se utilizar mas adelante. Paso 2 Se obtiene la columna (P) de rangos més altos y la columna (Q) de rangos més bajos que tengan como referencia la columna Ry. Esto se obtiene de la siguiente manera: Se considera el valor ‘numérico del primer nifo (en la columna Ry, 4", en nuestro ejemplo) y se cuenta hacia abajo cuan- tos valores numéricos son menores que él (en este caso 2, 1 y 3 son los tres valores menores que &); tambien se cuentan cuantos valores son mayores que é! (5, 6, 8, 7 v9 son los cinco valores mayores gue é) ‘Cantidad de Cantidad de Ry. rangos més altos _| _rangos més bajos |+— primer sujeto s 3 tres rangos mis bajos que ol primer sujeto cinco rangos mis altos que ¢l primer sujeto 114 Unidas Uno? MODELOS DETERMINISTICOS Para obtener el segundo sujeto (2 en nuestro ejemplo), hay uno més bajo que (el “1 bajo que el segundo sujeto)y seis mas altos que el segundo sueto G, 5,6, 8, 79). Cantidad de (Cantidad de rangos mds atos | _rangos més bajos S 3 | segundo sujeto 6 L [Arango mas bajo que et segundo sujeto seis rangos mis altos que el segundo sujeto sof slon]nfenleo} fool | En el caso de nuestro tercer sujeto (1) se excluyen los sujetos anteriores aly se sigue contando hacia abajo cudntos hay menores que él y cudntos mayores en su valor numérico. Para nuestro tercersujeto (1) no hay un valor numérico menor que & (0) pero hay 6 més altos G,5.6.8.7 y 9). Rx | By Rangos més attos | Rangos més bajos 1 4 2 2 tercer sujeto 3 1 }+— Gero rangos mas 4 3 ‘bajos que é) s s 6 6 seis rangos 7 BJS} mis altos que 8 7 el tercer 9 9 sujeto ‘Se seguir sucesivamente este método hasta el iltimo sujeto, que siempre va a ser cero rangos més altos y cero rangos mis bajos. Paso 3 Una vez que se tienen todas las columnas anteriores e obtiene la sumatoria dela columna de rangos mas altos, la cual la denotaremos como P. ‘Ala sumatoria de la columna de rangos mis tajos, la denotaremos como @. Rangos Rangos ‘mds altos. mds bajos Swjetos Rox Roy Rx__RY P 2 A Ree eam ry 3 3 B ag gt + 22 6 1 c pas St7yua pay 6 0 Cepltuo 4/ Andis de asociscén no paramétrico 118: Rangos Rangos més altos mis bajos Sujetos Rox Roy xy P Q D Meee 5 0 E noe eS 4 0 F A ete 66, 3 0 G rc eee ane 1 1 H eee Eas 1 0 1 Ee 9 0 0 rT 5 Paso 4 El resultado se sustituye en la formula (1) “Tau” de Kendall donde: 1m = Niimero de casos 6 sujetos; para nuestro caso n = 9 uma de rangos més altos (P = 31). Juma de rangos més bajos (Q 4.3 COEFICIENTE DE CORRELACION (,,,) BISERIAL DE PUNTO La correlaci6n biserial, en general, es una medida de asociacion entre dos variables conti- nuas que se distribuyen en forma continua, Por conveniencia una de ellas se ha dicotomi zado (si- no; falso - verdadero; masculino » femenino; casado - soltero; bueno - malo; etc.). La variable dicotomizada se supone discreta o discontinua cuando se trata de rela- cionar con la otra variable que permanece continua; el coeficiente més indicado para lie- vara cabo esto es el coeficiente de correlacion biserial puntual(r,), que se define en las: suiente forma: VIG Unidad Uno/ MODELOS DETERMINIsTICOS e (fox) — notEfx) V(ne n) nif? — (EAP donde: o = Aa VE n Niimero de sujetos. es a Frecuencia de ocurrencia de los puntajes obtenidos por los sujetos. x = Puntajes obtenidos por los sujetos. fx Producto de la frecuencia por los puntajes.. te Namero de sujetos que obtuvieron exactamente los puntajes x. ne = Sfe = Total de sujetos que obtuvieron exactamente los puntajes x. Ji = Niimero de sujetos que no obtuvieron exactamente los punajes x, ni, Nimero total de sujetos que no obtuvieron los puntajes x. fox = Producto del nimero de sujetos que obtuvieron exactamente los puntajes x por el puntaje x de cada sujeto representativo. Efe? = Suma de los productos dela frecuencia absoluta por os puntajesxal cuadrado. (Efo# = Cuadrado de la suma del producto de la frecuencia por los puntajes x. Efomplo 100 estudiantes de una escuela preparatoria se les aplca una prueba de conocimiento “x, que const de 40 reactivos, asi como la frecuencia con que se dstribuyen los 100 estudiantes, obte- niéndose los siguientes resultados: x £ 40 2 38 4 3 6 36 2 2 2 31 10 30 2 28 10 n 10 2s 4 m 4 2 3 20 3 18 3 16 a 2 2 10 1 m= 100 ‘Cuando se clabor6 dicha prucba x, se tivo especial énfasis en un reactivo, que en este ejemplo sel niimero 33. El eriterio para evaluar dicho reactivo 33 seré ““incorrecto o correcto”. Por consi~ auiente, se calcularé el coeficiente ry, utilizando los puntajes obtenidos por los 100 estudiantes en la prueba x y la respuesta al reactivo 33, que fue dicotomizado artficialmente como “ recto” Coptute 4/ Andlsis de asociacién no paraméivico 147 Paso 7 Se concentra la informacion de los resultados de la prueba x y la respuesta dada al reactivo 33 por los 100 estudiantes: En la columna (1) los puntajes, en la columna (2) la frecuencia con que ‘ocurren estos puntajes; en la columna (3) el nimero de estudiantes que respondieron en forma correcia el reactivo 33. Por lo tanto, en a columna4, al restr los puntajes dela columna (3) la co- lumna @), se obtiene la frecuencia de aquellos estudiantes que respondieron incorrectamente el reac- tivo 33 Oca eee ae Oe 38 4 fee) 3” 6 5 1 Borsa. acatrd cicuted 33; dd 2 asi 3110 perce: 0 oR eS 2% 10 6 sd 27 10 peer 25 4 1 3 ey 4 pots 3 2 3 ete 20 3 pee A 18 3 ee 73 16 2 1 1 2 2 Oe 10 1 OH Paso 2 Se obtienen los productos de ls valores de a columna (1) multiplicada por la colurmna (2). (0 sea fr, 1o cual forma la columna (5). Por dltimo se suman estos resultados para obtener Ti. 2 198, Unidad Unoy MODELOS DETERMINISTICOS Paso 3 Secleva al cuadrado cada uno de los puntajes x de lacolumna (1) y este resultado se mul- tiplica por cada uno de los valores fde la columna (2); esto da lugar la columna (6). Por dltimo, se ‘suman todos los valores y se obtiene Ejst, Paso 4 Se obtiene la columna (7) multiplicando los puntajes x de la columna (1) con los valores fe de la columna (3); después se suman todos estos resultados y se obtiene Efex. ® @ o © o Souk & pe fx 42 © 320 ate 12576152 7 6 mm 82a 8s 32 42015582360 Mosc sei 12288288 3110 3109610248 3 2 360 10800210 23 10 280 7840168 7 10 70 720189 Bee 10, 2am. 3. ens 9 23068 ey 6 i142 «2 mee @ 120 2% Tees. 4 mm 0 ees 32 526 Dee ey ns 0 tact 10 0 0 100 6337293289898 1:987 fone om Rf | Dt fer Paso Los resultados obtenidos en la tabla anterior se sustituyen en la definicin del coeficiente de corteccion biserial-puntual. n(Bfex) = nef) Vive nin Bt — EAL tee ___(1oaya 98) ~ 632932) © = Tanne we) — OT ni eee "» * F@33G9s 176) 13984 | fe 5074 SS Tip = 0.46 Capitulo 4/ Andis de asocincion no paramético 199) 4.3.1. Prueba de significancia y validez de r,, Dado que el coeficiente de correlacion biserial de punto, 0 puntual, ¢s un caso particular del coeficiente de correlacion lineal de Pearson, su significancia y su relacion en la pobla- n (recuérdese que se ha definido y aplicado con la informacién obtenida en una muestra) se lleva a cabo de la siguiente manera: Se establecen las hipétesis acerca de la cexistencia y no existencia de correlacion en la poblacién; en notacion estadistica se tiene: Hy @=0 Hi eto ‘Tambien se establece el nivel de significancia (a) con una probabilidad de error del 0.05, 0.01, 0.001, etc. Los grados de libertad se calculan de la siguiente forma: gl. = ‘con estos datos se compara el coeficiente r,,, calculado con el coeficiente critico que se obtiene por medio de la Tabla 4 del Apéndice con la siguiente regla de decision: Si Fp = Ties emtonces H, se rechaza, Para el ejemplo desarrollado se tiene lo siguiente: 98, debido a que n = 100 a = 0.001 Fro) = Fetes oy = Pos, 009 = el. 3211 El valor anterior obtenido de 0.3211, es para una prueba bilateral (dos colas). ‘Como 0.46 > 0.3211, entonces H, se rechaza, lo que significa que si existe correla. cién biserial puntual en la poblacién y que el valor de r), = 0.46 es significativo, Dado. que las correlaciones biseriales-puntuales se usan frecuentemente como indices de asociacion entre una pregunta en particular y el puntaje total de la prueba, dichas correlaciones son ‘muy dtiles para la selecci6n de preguntas (items) cuando las pruebas son disefladas y cons- truidas debido a que no existen pruebas que midan ciertas caracteristicas de interés. Por tiltimo, se deben tomar en cuenta las limitaciones der, cuando la variable conti- nua esté normalmente distribuida y la variable dicotémica tiene una probabilidad de cocurrencia de 0.5, esto es que cada vector de la variable dicotomica (falso-verdadero, correcto-incorrecto, etc.) tiene la misma posibilidad de ser escogido, 1 maximo valor que puede adquirirr, es 0.80; pero sila variable no dicotomizada es bimodal, el maximo valor de rp €5 0.90. Finalmente, interpretando el resultado de r,, = 0.46 en el ejemplo de los 100 estu- diantes de la escuela preparatoria a los que se aplica la prueba de conocimientos que cons- ta de 40 reactivos con la pregunta especial niimero 33 (incorrecto-correcto), aungue el co- eficiente obtenido de 0.46 no es tan alto, se concluye que existe una correlacion significati- va (dadas las limitaciones del biserial-puntual de 0.80), considerando también que la correlacion es positiva, esto significa que aquellos estudiantes que obtuvieron los puntajes ‘iis altos en la prueba tienden a obtener la pregunta 33 correcta, asi como aquellos que ‘obtuvieron puntajes bajos en el total de la prueba tienden a obtener la respuesta 33 in- correcta. Entonces, la pregunta 33 esta haciendo lo que la prueba se supone debe hacer; separar los estudiantes buenos de los mediocres. 120 Unidad Uno/ MODELOS DETERMINISTICOS 4.4 COEFICIENTE DE CORRELACION © (fi), PARA UN DISENO 2 x 2 Cuando ambas variables son nominales y dicotémicas, es posible determinar el grado de asociacién entre las variables de interés. Este coeficiente () también es un caso parti- cular del coeficiente de correlacion de Pearson, y se utiliza con cierta frecuencia, aunque no necesariamente en este aspecto, en la elaboracién y andlisis de pruebas. En capitulos posteriores se considerard la independencia o dependencia de dos variables en una ‘muestra determinada; cuando se haga este analisis, a partir de las hipdtesis establecidas, si la conclusién estadistica a la que se llega es la existencia de una dependencia, el analisis estadistico mas logico a seguir ¢s conocer el grado de asociacion que implica la dependen- cia entre las variables o las muestras. Para conocer esto, necesitamos un niimero, y este riimero nos lo indicard el coeficiente de correlacion ® (fi), pero recuérdese que esta supe- ditado al disefio 2 X 2, al tamafio de muestra y a a proporci6n de las variables dicotomi- zadas. Cuando el niimero de casos en una variable es igual al de la otra variable, el coefi- ciente & tendra el méximo valor de 1; cuando los totales marginales son diferentes no se alcanzara el méximo valor de 1. Ejemplo Se desea establecer una escala de medicion de cierto rasgo de agresion en adultos, Pero existe una interrogante, que consiste en saber si hay relacion entre el sexo de la persona y la respuesta (dicotomica) ante una sicuacion que afecte su actitud hacia la agresion, Por lo que a 400 personas, 200 del sexo masculino y 200 del sexo femenino, se les emplea para establecerdicha escala y se anali- zan las respuestas, obteniéndose lo siguiente: De las personas del sexo masculino 160 estan de acuer- do y 40 en desacuerdo; de as del sexo femenino 40 estin de acuerdo y 160 no lo estan. Caleule el co- eficiente & de correlacion y concluya, considerando los resultados obtenidos. Paso 1 Seacomodan los datos obtenidos en una tabla de doble entrada, de dos renglones y dos co- Jumnas (tabla de contingencia 2 x 2). Acuerdo Desacuerdo Total ‘Mesculino 160 0 200 Femenino 0 160, 200 Torat 200 200 400 Paso 2. Se aplica la definicion de &. ° donde: @ = Puniajes del primer renglon y ta primera columna (en este caso masculino y de acuerdo = 160). 6b = Primer renglon y segunda colimna (masculino y en desacuerdo = 40). ¢ = Puntajes del segundo renglon y la primera columna (femenino y de acuerdo = 40). = Segundo renglon y segunda columna (femenino y en desacuerdo = 160). Ccaotuo 4/ Anais de asociacén no paramétrico —-W21 Paso 3. Se sustituyen los datos anteriores en la formula anterior, efectuindose las operaciones. __ 0,160) — (40x40) “(00200 7200)2005 4.4.1. Prueba de significancia de & Para poder comprobar la significancia de dicho coeficiente se utilizara la siguiente defini- clon: eur donde: n = Namero total de casos (suma de los totales marginales, tanto de las columnas como de los renglones); en nuestro ejemplo n = 400. = coeficiente fi ® = 0.60 x¢ = ji cuadrada, que guarda Ia siguiente relacién, VE Sustituyendo los valores anteriores se obtiene: (4000.60)? = (400)(0.36) = 144 144 Este resultado se contrasta al valor crtico de ji cuadrada, calculado mediante la si- guiente resla de devision R.D, Si 722, entonces @ es significativa El valor critico de la x? esta en funcion de los grados de libertad y el nivel de signifi- cancia (a), establecido de antemano. Pat un diseflo 2 X 2, los grados de libertad seran j 422 Unidad Uno! MODELOS DETERMINSTICOS siempre igual a 1. Pero, en general, para cualquier diseito diferente al 2 x 2, se calcularan mediante la siguiente definicion: Bi. = — IKE D donde: Grados de libertad Namero de renglones de la tabla de contingencia. © = Namero de columnas de la tabla ce frecuencias observadas, gl Eneeste caso se tiene r 2y¢ = 2 (dos renglones y dos columnas), 0 sea: gl =@-N@-Nsixi=1 Comparando el valor calculado de x2, ji cuadrada, con el valor critico, que se consul- taen la Tabla 7 del Apéndice, con g.l, = 1, y estableciendo los niveles de significancia a = 5% Yar = 19, cyos valores Son: xen) = 3.84 xiuq) = 6.63, respectivamente. La ji cuadra- da calculada (x?) es lo bastante grande para estos dos valores, lo que significa que el coefi- ciente & = 0.46 jes significativo! 4.4.2 Requisitos de uso de AA fin de utilizar adecuadamente el coeficiente ®(fi) como medida de asociacion entre las variables x y y, dicotomizadas, se deben tomar en cuenta las siguientes condiciones: 1) Datos nominales. Las variables x y x, deben ser nominales y dicotomizables, va ‘que dinicamente se requeriran las frecuencias observadas (el nfimero de veces que ocurren en cisria nominacion). 2) Tabla de contingencia 2 x 2. Los datos deben poder colocarse en un disetio2 x 2 (dos renglones, dos columnas). Es inadecuado aplicar el coeficiente & (fia diseos mayo- res de 2 x 2, donde se comparan varios grupos o varias categorias. 43) Muestreo aleatorio. Para poder comprobar la significancia y validez de ¢, Ia muestra en estudio debe haber sido extraida en forma aleatoria (todos los elementos dela poblacion deben tener la misma posiilidad de ser escogidos). 44) Cuando la muestra en estudio es pequefia (un criterio es que la frecuencia obser- vada, en dos o mas casillas, sea menor que 10). Se utilizar la definicion de x*, pero con lt correccién de Yates, también llamada de Pirie-Handem, que consiste en lo siguiente: 5 nl|ad — bel -0.57 Y= Gs Da + Ob te +B) donde: jad — be| = valor absoluto de la diferencia entre ad y be; y como: NE Capua 4/ Andis de asociacion no paraméwnico 2B 4.4.3 Coeficiente de contingencia (C) Este ¢s un coeficiente de correlacin para datos nominales colocados en una tabla de con” tingencia (doble entrada) con un disefio mayor que 2 x 2. Con éste se trata de determinar cl grado de asociacién, comparando varios grupos o eategorias, y puede calcularse utili- zando la siguiente definicion: n+x donde: C= Coeficiente de contingencia. x? = Valor calculado de ji cuadrada. ‘n= Némero total de casos (tamafo de la muestra). Ejemplo Sedesea investiga la posible relacion entre cierto tipo de defecto genético, en recién na- dos, ya edad de la madre, cuando ocurrié el pato; se trata de encontrar el grado de asocicion si existe dependencia entre estas dos variables. El defecto genético se clasifica en cuatro tipos diferen- tes, que los llamaremos A, B, Cy D; la edad de la madre se clesificara en tres intervalos: menor de 25 aftos de edad, entre 25 y 40 afios de edad, y mayores de 40 afos de edad. Par llevar a cabo estees- tudio se consideran 309 nifios (n = 309) que han sido diagnosticados con defectos genéticos, Paso 1 Los datos obtenidos al realizar este estudio se concentran en una tabla de contingencia, de 1a siguiente forma: Padecimiento genético ‘edad materma | A B S D tonal menor de 25 anos | 1 4 Bers 137 entie 25 y 40anos | 33 0 6 20 19 mayor de 40 anos | 4 1 # 3 3 oat | as 74 109 38 309 ‘Silas dos clasificaciones son indepenclientes entre si, la posbilidad (proporcién relativa) de una casilla determinada serd igual al produto de su total marginal del renglon por el total marginal de su columna, dividido entre n, a eso se le llama frecuencia esperada (fe). Para caleuar la x? se puede utilizar la siguiente formula: ~ Dee donde: ‘fo = Frecuencia observada (se mide directamente) Je ‘recuencia esperada (producto total marginal dl renglon por el total marginal dela colurnna, divida entre »). 2A Unidad Uno/ MODELOS DETERMINISTICOS Paso 2 Calcular las frecuencias esperadas: 4 B c D TOTAL Menor de 25 afios | 51/39 46/328 25/483 15/168 137 Entre 25 y 40 anos | 33/33.9 17/285 49/42 20/146 119 Mayor de 40 aos | 4/151 11/127 35/187 3/65 3 TOTAL 88 m4 1098 309 137 x 88 fesr) = BRS = 39 felts) = IX 09 137 x 109 4p, seas) = HS x 38 309 Y asi sucesivamente se obtienen las demés frecuencias, hasta fe (3) 68 Paso 3 Para cada casilla se obtiene (fo ~ fe), lo cual despues se eleva al cuadrado en cada casilla para obtener (fo ~ fey. De este modo, nuestres casillas quedarian as: (61 = 3998 = (2p = 144 (46 — 32.87 = (13.2)! = 174.24 (25 ~ 48.3)? = (-23.3 = 542.89 G- 6.58 = (“3.97 12.25 Paso 4 Se divide eada uno de los resultados anteriores entre su respectiva frecuencia esperada Ue), sumindose dichos resultados 144 | 174.24 , Sg , 326, O81 , 19225, 49 , 29:16 , 12521 | 397 328 1687 33.9 * 28507 a * 146 715.1 289, 265.69 , 12.35 Tar sein. 63 3.7 4 S31 + 11.24 + 0.19 + 0.02 + 4.64 + 1.16 + 3.40 + 8.16 + 0.227 + 14.20 + 1.8 54.127 4.127 Capitue 4/ Andes do asociacién ro parametric 125 Paso § Se calcula el coeficiente C utilizando ta formula: Co Naat (sa er 309 + 54.127 [a Se 363.127 = OTS Oe C= 0.386 4. 4 Prueba de significancia La significancia estadistica del coeficiente de contingencia se puede obtener a partir dela magnitud de la x? obtenida con la siguiente regla de decisio Si x? = xa entonces Ces significative El valor de la x? critica (x, )se leer en la Tabla 7 del Apéndice considerando los gra- dos de libertad de la siguiente manera: al. = @- De =) donde: Nimero de renglones, Niimero de columnas. Para nuestro ejemplo: gl. =@- 14-1) =2%3 8. Por lo que el valor de x4.) al nivel de significancia del 5% es 12.6 y del 1% es 16.81, pero dado que el valor de la x2 caleulada es de 52.7 es mayor que cualesquiera de los dos valores anteriores, en consecuencia el coeficiente de contingencia calculado es estadistica- mente significativo, por lo que rechaza la hip6tesis nula; por lo que los tipos de defectos de nacimiento dependen de la edad de la madre. Requisitos para el uso del coeficiente de contingencia: 1) Datos nominales. Solo se requieren datos de las variables dicotomizadas, las cuales se colocan en una tabla de contingencian x m. 126 Unidad Uno/ MODELOS DETERMINiSTICOS 2) Muestreo aleatorio, Con la finalidad de comprobar la significancia estadistica del coeficiente de contingencia, la muestra se debid haber obtenido en forma aleatoria, 4.5 COEFICIENTE V DE CRAMER El coeficiente C tiene una desventaja que consiste en que el niimero de renglones y colum- rnas de la tabla de contingencia influira en el valor obtenido de C. Esto significa que el co- cficiente de contingencia no siempre variara entre Oy 1 (por supuesto, nunca excederd de 1). En ciertas condiciones, el méximo valor de C podra ser de 0.94 pero, en general, es de 0.89. Para resolver este problema se puede emplear otro coeficiente de correlacién, el cual cexpresa el grado de asociacion entre variables nominales, pero en tablas mayores de 2 x 2. Este coeficiente es el de Cramer V, que se define de la siguiente manera: ne = 1) donde: 1 = Total de casos (tamafo de la muestra), L = Columna o renglon mas pequetio de los dos. Este coeficiente, a diferencia del C, tiene como limite superior a 1. ‘Como prueba de significancia, cuando la x? que se utiliza al calcular V es estadisticamente significativa, entonces dicho coeficiente es estadisticamente significativo. Ejemplo A 350 estudiantes de una escuela preparatoria se les aplica una prueba que mide habil dad verbal; los resultados se correlacionarén con los obtenidos en la materia de historia de México Por estos mismos estudiantes en una prueba escrita al final de dicho curso. Los resultados que se ob- tuvieron se muestran en la siguiente tabla de contingencias: Calificaciones en Historia de México o-81 8 Inferiora6 Total ‘Superior 2600 100 15 5 120 Habilidad Entre verbal 500 y $99 50 8s 15 150 Inferior 2 500 10 20 50 % Total 160 120 7 350 Capo 47 Analisis de asocicién no paramétrica 127 Paso 1 Se calculan las frecuencias esperadas (fe) mediante sus correspondientes totals marginales ¥ dividiéndolos entre el total: (54.5), (41.1), 24)...» (16) Paso 2 Se calcula el valor de 32, uilizando la formula conocida: pint 1 xt = 196.6 Paso 3 Se sustituyen los valores de N = 350, nicién de V. = 3, y dela x obtenida anteriormente,en la defi. = a ML-1) V2 053 4.5.1 Prueba de significancia de V De la misma manera que C, en el coeficiente V de Cramer se obtiene la prueba de signifi- cancia, 0 sea que si x? = x4y , entonces Hy se rechaza y el coeficiente V es significativo, Para a = 5%, a = 1% ya = 0.005 con gl. = 3 — 1)3 ~ 1) = 4, se obtienen: x24, 0.05) = 9.49 x24, 0.01) = 13.28 x44, 0.005) = 14.86 ‘Como 196.6> > 14.86, el coeficiente V = ).53 es significative. 128 Unidad Uno/ MODELOS DETERMINISTICOS Conctusién Las calificaciones obtenidas por los 350 alumnos de dicha escuela prepara- toria, en historia de México, no son independientes de los puntajes que obruvieron en la prueba de “‘Habilidad verbal”, 4.6 COEFICIENTE DE CONCORDANCIA, «, DE KENDALL Este coeficiente puede ser considerado el promedio de un grupo de coeficientes de Spear- ‘man, 0 sea que w es una medida del grado de acuerdo o concordancia entre m conjuntos de n rangos. Esto significa que si tenemos un grupo de m objetos jerarquizados 0 eva- luados por m jueces, w nos provee la informacién concerniente del grado de acuerdo de los m conjuntos de rangos o jerarquizaciones otorgados por los jueves. Una de las diferencias entre r, (Spearman) y w (Kendall) es que w siempre sera positi- vo, por lo que su intervalo de valores es de 0a 1. Sila evaluacion otorgada por cada uno de los jueces a los m objetos es la misma, en- tonces » = 1.0; en cambio, si existe un total desacuerdo entre ellos, w = 0, Pero debemos enfatizar que lo medido por «es el acuerdo (concordancia) entre 10s jueces con respecto a 1o medido, y aunque w sea grande (muy cercanamente a 1.0), no necesariamente significa que la evaluacién otorgada por los jueces sea la correcta. Esto es, este conjunto de jueces pueden estar perfectamente de acuerdo en una evaluacién que es incorrecta en términos de un critetio externo; 0 que dichos jueces utilizaron el mismo criterio de evaluacién o los. mismos estandares, independientemente de si dicho criterio es el mas adecuado o correcto. Por otro lado, si los jueces no se ponen de acuerdo (w = 0), puede ser debido a que los atributos que se tratan de evaluar son ambiguos 0 pobremente definidos, o también se puede considerar que dichos objetos no difieren significativamente en grado de posesién de la caracteristica o atributo medido en tal forma que la discriminaciOn no sea posible, entonces no podemos esperar que la opinién de los jueces sea altamente concordante. Fjemplo Supongamos que a4 catadores de vino (m = 4 jueces) se les presenta un grupo de'$ vi fos diferentes (n = 5), obteniéndose la siguiente informacion: (Opinion de tos Vino |” catadores (jueces) | Sumas de los rangos (R) =~ 12345 1 545 65 19 2 3323 n 3 1212 6 4 Post 7 3 4544 7 ER= 60 ‘Calular el cocficiente w de Kendall, o sea la concordancia entre las opiniones otorgadas por los 4 jueces, donde el mayor puntaje (5) significa que et vino reine varias caracteristicas de calidad, (4) reline menos, y asi sucesivamente hasta llegar a (1), donde el vino es de baja calidad, Paso 7 Las jerarquizaciones otorgadas por los 4 jueces a cada vino se suman y se colocan en una ‘columna, como se muestra en la tabla anterior, Captuo 47 Andlsis de asociscién no paeméiics 129 Paso 2. Sino existe relacion entre la jerarquizacién otorgada por los jueces (w = dichas jerarquizaciones para cada uno de los n objetos (vino), deberia ser la misma. Sisto hubiese ocurrido en nuestro ejemplo, la suma deberia de ser 12, o sea Ia suma total entre cel ntimero de casos (60/5 = 12). ), a suma de Paso 3 Se obtiene la diferencia (D) entre la suma de cada grupo de jerarquizaciones el promedio de 12, y se colocan los resultados (D) en la columna 2. a m w 2 vINo_| Rago de los catadores | Suma de los ranges | Diferencia de rangos 1234 R D==R-2 vi 3455 | 9 q a 33S 0 1 4 3 ia 6 oA 4 21a 7 <5 s 4544 ” 5 : ER = @ Paso 4 Se clevan al cuadrado estas diferencias (D), se colocan los resultados en Ia columna 3 y se cobtiene su suma. 1" m w 2 VINO | Rango de los jueces (catadores) | Suma de rangos Dif. derangos | (3) Loa R D = 1 seus » 7 | « 2 3323 it ese il 3 1212 6 6 | 236 4 4 Biilicdeh a 5 | as 5 46S bk ” 5 [3s a ER = © ED = 136 Paso § Se calcula w, utlizando la siguiente formula: ep wag =D 12.(136) SSD 1632 1632 axsyaay * “1s29* ° = O88 } Con los resultados obtenidos anteriormente, se puede comprobar lo siguiente: La suma de las jerarquizaciones (ER) es igual al producto de! nimero de catadores { (m = 4)por el ntimero de objetos evaluados, vinos (n = 5), y por (n + 1); todo lo ante- rior dividido entre 2, o sea que se debe obtener 60 = 60. 130 Unidas Uno MODELOS DETERMINiSTICOS Esto es: mn(n + 1) Como ER = 60; 4.6.1 Prueba de significancia de w La significancia estadistica de «se evalia utilizando la Tabla 13 del Apéndice. La forma de entrar en esta tabla es con m = 4 (jueces) y n = 5 (vinos), 0 sean los objetos jerarquizados 0 calificados. Se observa que al nivel de significancia del 1%, el valor de uy = 0.67 ¥, da- ddo que nuestra w (la calculada) es de 0,85 y supera al valor de 0.67 (el de la tabla), se puede concluir que este coeficiente de concordancia w es significativo a partir del 1% y, por su- puesto, al 5% (a, = 0.54) por lo que los catadores hicieron un buen trabajo al evaluar es~ tos 5 vinos. ‘En general, la regla de decision para ¢l coeficiente de concordancia w de Kendall es la siguiente; Siw = up, entonces w es significativo Conclusién « = 0.85 nos indica que existe un alto grado de acuerdo (concordancia) en- te los cuatro jueces (catadores de vino) én la evaluacién de las bondades de los cinco vi- nos catados por ellos. RESUMEN Existen varias alternativas no paramétricas para el coeficiente de correlacion lineal de Pearson r, a fin de determinar la relacion entre las variables diferentes a las intervalares, tales como: Ordinales, dicotomicas o nominales. ‘Cuando el tipo de variables que intervienen en nuestro analisis estadistico a efectuar son ordinales, y la muestra es pequefia, asi como la distribucion de éstas no sigue el mode~ Jo normal, el coeficiente de correlacién por intervalos jerarquizados (r,) de Spearman 0 el coeficiente “tau” (7) de Kendall, que en ciertas situaciones es preferido a r, son los adecuados para encontrar la relacion y el grado de asociacion de este tipo de variables; o bien se puede obtener un valor estadistico (el coeficiente de concordancia «), que ademas de jugar el papel de coeficiente promedio de un grupo de coeficientes de correlacion de Spearman, nos suele medir el grado de concordancia existente entre la opinion o califica- Cepitue 4/ Andiss de asocacién no paramética 131 cin que bajo determinado criterio tienen un grupo de personas (jueces) ante una si- tuacién de tipo subjetiva. Cuando en el caso de enfrentarse a un evento en el que una va- riable es continua y la otra dicotémica, el coeficiente biserial puntual (r,) es el adecuado para determinar las posibles relaciones entre estas dos variables. El andlisis de frecuencias observadas, variables nominales, de caracteristicas en las cuales no es posible obtener un valor numérico, y que al mismo tiempo se clasifican bajo situaciones excluyentes en las tablas de doble entrada, o también llamadas de contingen- cia, representan uno de los procesos mas antiguos y ttiles empleados por los investigado- res de las ciencias sociales y del comportamiento. Para este analisis ¢s posible obtener el coeficiente C de contingencia o el V de Cramer, cuya interpretacion es la misma, pero los requisitos de uso varian segiin el tamaflo (nimero de renglones por nimero de columnas) ue dicha tabla de contingencia tenga, Io cual repercute en el ntimero de casillas 0 clasifi- caciones del problema a resolver. PROBLEMAS 4.1. Las puntuaciones de la siguiente tabla son de la aplicacion de una pruebe de aptitud y la eall- ficacion final de un curso de formacion, en la que se determina si se es 0 no apio, Puntuaciones Apto No apto 9 ° 1 8 2 2 1 B 4 6 10 5 5 2 4 4 10 8 3 6 10 2 2 10 1 0 2 Mediante ta formula NNN E59 ~ CAP caleule el coeficiente_puntual de los datos. 4.2 Sedesea construir una escala para medir la actitud hacia la homosexualidad (masculinay fe- ‘menina) en el pais. Una de las preguntas propuestas es: {Piensa que los habitantes del pais estén conformes con el manejo que hace el gobierno en relacin con este sector de la pobla- ion? Elcuestionario frecuentemente a una muestra de 200 personas, la distribucion respecto de la poblacién total obtenida en la escala, se presen- apli de las respuestas si” y “ne 1a a continuacién: 132 43 44 4s 46 a7 65-69 {Unidad Uno MODELOS DETERMINISTICOS Toul = “Si” “'No”™ 95:9 9094 85.99 80-84 75-79 70-74 eRe ne od 55-59 50-54 4549 40-44 3539 3034 2529 Toul 140 Burcusadoeue-—ree Caleule, entre la pregunta y la poblacion total obtenida, el coeficiente ray de correlacién biserial-puntual Del problema 4,1, caleule el coeficiente biserial (7). De los siguientes datos caleule el coeficiente &, Correct Incorresto Inferior | 65 8 Superior | 25 1s ‘De los datos del problema 4.1 determine cufl es la relacidn del valor de coeficiente r,tetraco Los alumnos de primero y segundo semestre de la Facultad de Ingenieria calificaron a un sgnipo de 7 profesores, de acuerdo con la claridad de su exposicién. Los resultados fueron ta- Dbulados de la siguiente manera: Profesor Primer semestre Segundo semestre 1 “4 38 2 9 2 3 36 18 4 35 2 3 3 31 2 6 2» 38 1 2 38 De los datos anteriores determine el coeficienter, de Spearman. Caleule €l coef te de Kendall (r) de los datos del problema anterior. 48 49 410 Capitulo 4/ Angie ds asociacén ro paramétrico 183 ‘Cuatro jueces hacen una clasificacién, por rangos, otorgansu disposicién para dar la liber- tad condicional a un grupo de ocho presos, El resultado es el siguiente Tucces Penados 1 2 3 4 1 Jonsdrdelecaed 2 2 ssid credctu 3 deo oe 4 Bed 8. 5 S62 5528 oath GOL G eg T 7 TT Ras 8 sofe 7 8 Indique el grado de acuerdo entre os jueces, mediante el coeficiente de concordancia w, ‘Con los datos de la siguiente tabla calcule el coeficiente de correlacion de Spearman y su ra- ‘Columna x y ° 9 2 1 1s 2 2 20 202 3 B 248 4 18 196 5 30 278 6 18 139 7 15 123 8 2 13 9 " 65 10 7 8 n 10 50 Bf = 200 (Ey) = 1648 (Con la finalidad de estudiar el nivel de asimilacin de las matematicas por parte de fos alum ‘os, un investizadorestablecé la relaciOn entre las puntuaciones de acuerdo coa una prueba 4de capacidad espacial y otro de rapidez de cilculo, observando las siguientes conclusiones: Capacidad Rapidez —_Asimilacion espacial de caleulo de conceptos Capacidad espacial 04522 0.496 Rapidez de célculo a es 0.284 Asimilacién de conceptos | — 2 = 134 41 412 413 Unidas Uno MODELOS DETERMINISTICOS 4) Eliminando la influencia de la rapidez de céleulo, determine cusl es la correlacion entre la asimilacion de conceptos y la capacidad espacial, ») Eliminando la influencia de la capacidad espacial, determine cual es la correlacion entre Seastrdlecit Ge caccepicay rable oe ileal” Entre as califcaciones de un curso de maestria industrial y una prueba de capacidad mecéni- ‘a, el coeficiente de correlacin es de 0.50, y en una prueba de destreza manual es de 0.20. Caleule el coeficiente de correlacion miltipl entre dichas calificaciones y los efectos combi- nados de las puntuaciones obtenidas segin las pruebas de capacidad mecénica y de destreza manual CCaleule las correlaciones por rangos ordenados de Spearman en los distintos conjuntos de puntuaciones que a continuacion se proporcionan. A BCD 1 6 m4 2 a 2 169 167 48 $4 37 8 43 4°93 16 34 45 3 8 6S 24 38 6m wn R 7 136 145 34 36 8 99 6 38 9 87 98 2 37 10 10 98 64 © 11 107 108 47 66 12 119 87 45 45 1B 67 7% m4 a 14 78 100 20 46 15 186 16957 55 16 13. 97 45 47 17 145 159 40 40 18 65 78 20 33 19. 106 106 34 48 20 98 108 34 32 2 16 96 49 48 22 119 128 60 $4 23 100 109 24 44 24 118 109 36 56 4 25 184 1m BR 2 2% 7 8 23 9 27 109 101 41 47 28 88 108 31 48 29 67 76 18 @ 30 89 100 47 68 ‘A los alumnos de tercero, euarto y quinto grads inscritos en 1966 en la escuela de ciencias politcas y sociales, se les pregunt6 cuales son las materias fundamentales para su formacion. 414 4s Caotulo 47 Anblcie de ascciscén no paraméuico 135 profesional de las que imparten actualmente en el segundo aito, Dé las frecuencia porcen- twales de las respuestas que se presentan a continuact6n; Porcentajes Materias Diplomacia Politica Sociologia Periodismo Teoria econdmica o 0 6 7” | Teoria del Estado B n 30 a Teoria sociolbgica 21 8 89 a 4 Sociologia de México 50 46 29 4l 1 Teoria de Invest. de { campo 9 ey 70 9 Estadistica 0 56 80 a Derecho constitucional 91, 4 B 2 Idiomas 48 n u 2 Calcul el coeficiente w de Kendall, ¢ indique Ia magnitud del acuerdo existente entre las ‘cuatro especialidades, ‘A doce candidatos para ocupar un puesto administrativo se les aplican dos prucbas, una de personalidad y otra de liderazgo; la primera medida por la escala F* y la de iderazgo por el : apoyo de las afirmaciones de lider por simpatia, por agresividad y por conocimientos (os do- ce candidatos son estudiantes universitarios), [Los datos son los siguientes Estudiante Personalidad Liderazgo A 2 2 B 38 46 ¢ 37 9 D 4 37 E 116 6s F U3 88 a Mm 86 H 83 56 1 85 a J 126 2 K 106 sa L 7, aL 4) Caleule el coeficiente de correlacion (7), b) Concluya, ‘A doce sujetos se les aplica una prueba para medir su agresividad y adaptabilidad a las nor- ‘mas sociales (tomando como normas el ser sociable, trabajador y tener relaciones informa- se desea saber el grado de relacin, 196 Unidad Uno” MODELOS OETERMINISTICOS ‘A-continuacion se dan los puntajes jerarquizados: ABCDEFGHIIJIKL Sujeto 725 9 Agresividad es ‘Adaptabilidad a Rupa | 4 ek 1 0 es de tt a) Caleule r de Kendall, b) Caleule r, de Spearman, 416 Se realiza una investigacién entre doce empleados piblicos administrativos para ver qué orrelaciGn existe entre los rangos de motivacion personal y de concimiento de su puesto asi fomo de conformidad y desarrollo laboral, (Considérese la conformidad como variable @ parcializar.) ‘A continuacion se dan los datos: Motivacion Conocimiento de puesto Conformidad y desarrollo Sujetos personal de trabajo laboral peer at age a ee a x y z A 3 2 13 B 4 6 1s ¢ 2 5 38 D 1 1 35 E 8 10 50 F 10 9 60 G 10 8 1.0 H 6 3 8.0 1 7 4 9.0 J 2 2 10 K 5 1 10s L 9 n 2s Calculer: ®t b) te 8 toe ‘417 Esta investigacion esthreferida a conocer la relacin entre la eleccin de diferentes cursos, dependiendo de la clase social, entre adclescentes de nivel secundaria. Bl nimero de sujetos sdiados fue de 390, Las clases sociales se dividieron en A, B, C, D, E. Los cursos fueron: Preparatoria, técnica y comercial, Hy. Laeleccion de los estudiantes insritos en los tres cur~ Sos que se ofvecen, es la misma en todas las clases sociales. 4, La elecciOn de fos estudiantes inscrtos en los tes cursos que se ofrecen, difieren de una clase social a otra. Nivel de signifi cacion: Sean a = 0.01 ym = 39. 4) Caleule el coeficiente de contingencia 'b) Concluya con respecto a las hipotess. 48 419 Capitulo 4/ Andlss de asociacon ro paraméuico | 137 Curso ‘Amas de casa Estudiantes Empleados Desempl, Total Preparaioria 23 0 16 et ar Tecnica nt 8 107 4207 Comercial i at 0 0107 Total 38 146 183 2% 30 Dos profesores de diferentes materias y del mismo grupo, jerarquizan a sus estudiantes, segin l desempeno en sus respectivas materias. Con los datos obtenidos, se establecen las siguien- tes hipotesis: ‘Hg: No existe correlacion entre ambos puntaje. Hy: Si existe correlacién entre ambos puntajes. Compruebe dichas hip6tesis, utilzando la raz6n ¢y el coeficiente de correlacion de Spear- Prof, A Prof.B Prof. Prof. B 1Orieoms: 120125 2 eco) 40128 3002S 40 140 40 23 40 150 SS. 150. 160 165 SS sy 160 16.5 eS 1s 165 Reged 1s 18.0 dete Xe 8s 105 uo 105 Se aptica una prucba a una muestra escogida al azar de una colonia cuyos habitantes pertene- cen & un nivel econdémico bajo; se desea saber el grado de correlacién entre dos respuetas. “H. No existe grado de correlacion entre ambas respuesta, H,, Si existe grado de correlacion entre ambas respuestas, R, Ry Rangos Diferencias Respustas AB D Db Dy, sabbath? sot Ghecoaaiee 16 Meth an tease ee 16 Se RT ee 16 lo ee ee 3 9 GE Se 1 1 1, 6 3 9 a CS <= 1 re eS as Gf ok 9 aS = 0s, 0s Te 4S a0 2: 8 6 r= 134s 138 4.20 4.21 422 423 ‘Unidag Uno/ MODELOS DETERMINISTICOS Se desea conocer el grado de correlacion entre ls puntuaciones de un grupo de alumnos de C.C.H. de dos clases diferentes, Psicologia y Etica Psicologia tica Rangos _Diferencias x Yoo aed Dt o 6 18 2 0S O25 oT «8 1S 2-05 025 ne ear rs hay nN 3S 4 -05 025 Rens se as »p m6 60 os wR er Berg a Rie ee RSE y BO x eens 9959-90 - 3 = 1 00 = ED? = 1.00 Caleular el coeficiente de correlacion a) Biserial rq (2 = —0.25) yf) b) Biserial-puntual ye 387 Para los siguientes datos, donde X = 0 (acttud reprobatoria del profesor hacia el alumno) y X = 1 (actitud aprobatoria del profesor hacia el alumno), son los puntajes en una prueba de ‘coniocimientos (¥), AB COEF GH II.KLMNO Be] 08 Osh gOdesrkised: sdesdaeilsadh ol hedserdao a Vilice $743 78 8 6 8 tees La tabla anterior nos muestra los puntajes obtenidos por quince nersonas, Caleule el coeficiente de cortetacin biseral- puntual (x). AA tres psicblogos de diferentes Areas se les dan las mismas instrucciones para entrevistar 6 aspirantes a un empleo, pidiendo que no se comuniquen los resultados entre si Al psicblogo del trabajo se le asigna ““X”, al clinico "*Y", y al educativo "2 La siguiente tabla muestra los resultados: Solicitante ABCDEF Psicologox] 1 6 3 2 5 4 PsicdlogoY | 1 5 6 4 2 3 PsicdlogoZ | 6 3 2 5 4 1 Rj sun i ns 424 425 4.26 [Coptuo 4/ Andis de esociacién no pararétrico 139) 8) Caleule el coeficiente de concorda; de Kendal De una reciente investigacion realizada por el Instituto Nacional del Consumidor se ‘muestran los miligramos de nicotina y alquitran encontrados en 10 marcas de cigarros, Tipos de Contenido Contenido _—Tipos de Contenido Contenido cigartos de alquitrin de nicot Sigarros de alquitrin de nicotina Marea 1 4 09 Marca 6 B 08 Marea 2 n Mi Marca 7 um 15 Marca 3 28 16 Marca 8 25 La Marca 4 7 13 Marca 9 18 12 Marca 5 16 10 Marca 10 31 20 CCalcule el rango de coeficiente de correlacion para medi el grado de relacién entre elal- ‘quitran y la nicotina contenida en los cigarros. En un estudio realizado a 200 mujeres casadas, sobre relaciones hummanas, habia dos pregun: tas que consistian en lo siguiente: ) :Considera exitoso su matrimonio? ) gTuvo una nifez feliz? Se obtuvieron las siguientes respuests: Matrimonio Nittez | Noctitoso Exitoso Total Feliz 40 7 0 No feliz o 30 0 Total 100 100200 {GExiste alguna relacién entre a) y b)? En un concurso de belleza hay 7 jueces, los cuales tienen que catalogar en orden de 1 a 10; ¢ obtuvo la siguiente tabla: Participates Tees | AB UC pe RoR. Gaur 1 9 1 8p Ts Set aa 2 aug cto 5) 2 De 883g S34 9. 10 3 Nog 27 Go ted lcs 0, 9 4 Sn8 7d A Sos een 0. 9. 5 SACS POST SG 0. 7 oe 6 Bes Gc 3 Pa Tags 87 7 Bos. 2s 5. ie a ets 409 Wi. | 4 38 8 2 16 13 4 8 61 140 427 4.28 Unidad Uno MODELOS DETERMINISTICOS 4) Caleule el coeficiente de concordancia de Kendall, ») Utilce a siguiente fOrmula para encontrar una interpretaci6n en términos de valor pro. ‘medio det coeficiente de Spearman (r,) en todas los posibles pares ordenados. promedio n= 1 = coeficiente de Kendall m= nitmero de filas, AA diez estudiantes se les aplco un examen de fisca al inicio del curso y ele hizo otroal final; se obtuvieron los siguientes resultados: Examen al inicio Examen al final Estudiante del curso del curso, A 84 13 B 98 63 cS 9.1 87 D 12 66 E 86 78 F 93 78 G 80 9 H 0 0 1 92 88 J 87 17 4) Calcule el coeficiente de correlacin de Spearman, b) Pruebe la hipdtesis nula p, = 0 contra la hipbtesis alterna de que p, > 0 usando a = 0.028. ‘Se realizb un experimento con ratas de laboratorio alas quese aplic6 un firmaco, y eles pu- 50 en un laberinto para ver el tiempo que tardaban en recorrerlo, Los resultades fueron los siguientes: Miligramos de Tiempo de re- irmaco por corrido en gramos de peso el laberinto oo ~~), 10.0 187 105 215 11.0 iss us 19.6 120 182 125 20.8 130 216 138 24 140 233 14s 196 15.0 23.8 15.5 21.7 16.0 232 Captuo 4/ Andis de asociacon ro paremétrico 141 4) Caleule la correlacion 7, 'b) Pruebe la hipotesis para un a= $% de que dichas variables son independientes, | 4.29 Se realizo un estudio para determinar si el flujo sanguineo cerebral en hombres adultos puede predecirse de la presion arterial del oxigeno (mil de mg); en este estudio participaron 15 voluntarios y se obtuvieron los siguientes datos: Flujo sanguineo Tension arterial del w coxigeno (X), 84.33 603.40 i 87.80 $82.50 2.20 $56.20 78.21 594.60 73.44 358.90 0.01 i 83.53, i 19.46 75.22 76.38 71.0 78.80 80.67 86.60 78.20 8) Caleule el coeficiente de correlacion r, 4.30 Se tienen 9 modelos de automéviles de 4 cilindros y se realiza una encuesta para ver la prefe- Fencia del publico, donde 1 significa mayor preferencia; se conocen los previos de cada uno en el mercado, los cuales también se jerarquizan y donde 1 es el més caro. Los siguientes resultados muestran la preferencia de una muestra homogénea de profesores de una univer. sidad Urilizando « = 0.05, compruche las siguientes hipotess Hy, El orden de preferencia es independiente del precio del modelo en el mercado, 1,. Ambas variables son dependientes; ast, el precio del modelo depende del orden de referencia Modelo referencia Precio en el mercado 4

También podría gustarte