27 - Estadistica No Parametric A II

DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA
ESTADSTICA NO PARAMTRICA
AUTOR: Irene Guilln Luna Curso 2007/08
NDICE
1.- INTRODUCCIN A LA ESTADSTICA NO PARAMTRICA
2.- PRUEBA DE LA MEDIANA
3.- PRUEBA KUSKAL-WALLIS
4.- Q DE COCHRAN
5.- F DE FRIEDMAN
6.- CONCORDANCIA DE KENDALL
7.- Y EN EXCEL?
BIBLIOGRAFA
1.- INTRODUCCIN A LA ESTADSTICA NO PARAMTRICA La Estadstica no paramtrica es una rama de la Estadstica que estudia las pruebas y modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su distribucin no puede ser definida a priori, pues son los datos observados los que la determinan. La utilizacin de estos mtodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribucin normal o cuando el nivel de medida empleado no sea, como mnimo, de intervalo. Las principales pruebas no paramtricas son las siguientes:
Prueba de chi-cuadrado. Mide la discrepancia entre una distribucin observada y otra terica (bondad de ajuste), indicando en qu medida las diferencias existentes entre ambas, de haberlas, se deben al azar. Tambin se utiliza para probar la independencia de dos muestras entre s, mediante la presentacin de los datos en tablas de contingencia.
Prueba binomial. Analiza variables dicotmicas y compara las frecuencias observadas en cada categora con las que cabra esperar segn una distribucin binomial de parmetro especificado en la
hiptesis nula. El nivel de significacin crtico de esta prueba indica la probabilidad de obtener una discrepancia igual o superior a la observada a partir de la muestra si la distribucin es la postulada por la hiptesis nula.
Prueba de Anderson-Darling. Este test determina si los datos vienen de una distribucin especfica. Prueba de Cochran. Permite efectuar un test estadstico para comprobar si existe una diferencia significativa entre tests realizados. Prueba de Cohen kappa. Test que evala las concordancias y discordancias intra e interobservador respecto a una variable nominal
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA Prueba de Fisher. Prueba de significacin estadstica utilizada para comparar proporciones en tablas de contingencia. Prueba de Friedman. Consiste en ordenar los datos por filas o bloques, reemplazndolos por su respectivo orden. Al ordenarlos, debemos considerar la existencia de datos idnticos. Prueba de Kendall. Es usada para comprobar el grado de coincidencia de las valoraciones realizadas por lo expertos.
Prueba de Kolmogorov-Smirnov. Se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre s. Prueba de Kruskal-Wallis. Sirve para testar si un grupo de datos proviene de la misma poblacin. Intuitivamente, es idntico al ANOVA con los datos reemplazados por categoras.
Prueba de Kuiper Prueba de Mann-Whitney o prueba de Wilcoxon. Se aplica a dos muestras independientes, cuyos datos han sido medidos al menos en una escala de nivel ordinal. La prueba calcula el llamado estadstico U, cuya distribucin para muestras con ms de 20 observaciones se aproxima bastante bien a la distribucin normal.
Prueba de McNemar. Se utiliza para decidir si puede o no aceptarse que determinado ''tratamiento'' induce un cambio en la respuesta dicotmica o dicotomizada de los elementos sometidos al mismo, y es aplicable a los diseos del tipo ''antes-despus'' en los que cada elemento acta como su propio control.
Prueba de la mediana. Se trata de un caso especial de la prueba de chi-cuadrado, pues se basa en esta ltima. Su objetivo es comparar las medianas de dos muestras y determinar si pertenecen a la misma poblacin o no.
Prueba de Siegel-Tukey: Consiste en determinar una mnima diferencia significativa tal que toda diferencia entre dos medias que sea superior a ese valor se declara significativa.
Coeficiente de correlacin de Spearman. Mide la asociacin o interdependencia entre dos variables discretas. Para calcular , los datos son ordenados y reemplazados por su respectivo orden.
Tablas de contingencia: Se emplean para registrar y analizar la relacin entre dos o ms variables, habitualmente de naturaleza cualitativa -nominales u ordinales.
Prueba de Wald-Wolfowitz: Las prueba de rachas es una prueba no paramtrica, capaz de manejar variables cuantitativas y cualitativas de tipo dicotmico. La utilidad de esta prueba, abarca diferentes campos de la actividad humana y puede servir desde para probar la aleatoriedad: de las encuestas aplicadas por los entrevistadores, de las fallas de la maquinaria en la produccin, de las cantidades compradas o vendidas, de las faltas de los empleados, hasta para controlar la calidad de la produccin.
Prueba de los signos de Wilcoxon. Compara la media de dos muestras relacionadas para determinar si existen diferencias entre ellas. La prueba de Wilcoxon se aplica al caso de las distribuciones continuas simtricas, bajo estas suposiciones, la media es igual a la mediana y el procedimiento puede emplearse en probar la hiptesis nula que U=Uo.
De forma general, en todas ellas se parte de la base de que algunos contrastes de hiptesis dependen del supuesto de normalidad, muchos de estos contrastes siguen siendo aproximadamente vlidos cuando se aplican a muestras muy grandes, incluso si la distribucin de la poblacin no es normal. Sin embargo, muchas veces se da tambin el caso de que, en aplicaciones prcticas, dicho supuesto de normalidad no sea sostenible. Lo deseable 5
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA entonces ser buscar la inferencia en contrastes que sean vlidos bajo un amplio rango de distribuciones de la poblacin. Tales contrastes se denominan no paramtricos. Los contrastes no paramtricos son generalmente, vlidos cualquiera que sea la distribucin de la poblacin. Es decir, dichos contrastes pueden ser desarrollados de manera que tengan el nivel de significacin requerido, sin importar la distribucin de los miembros de la poblacin. La mayor parte de las tcnicas estudiadas hacen suposiciones sobre la composicin de los datos de la poblacin. Las suposiciones comunes son que la poblacin sigue una distribucin normal, que varias poblaciones tienen varianzas iguales y que los datos se miden en una escala de intervalos o en una escala de razn. Este tema presentar un grupo de tcnicas llamadas no paramtricas que son tiles cuando estas suposiciones no se cumplen. Como se ha indicado anteriormente existen otras muchas pruebas estadsticas diseadas para situaciones en las que no se cumplen las suposiciones crticas o que involucran datos cuantitativos o categricos. Se presentarn aqu unas cuantas de las pruebas no paramtricas que mas se usan. Qu ocurre con las pruebas no paramtricas frente a las que si lo son? Las pruebas no paramtricas no necesitan suposiciones respecto a la composicin de los datos poblacionales. Las pruebas no paramtricas son de uso comn: 1.- Cuando no se cumplen las suposiciones requeridas por otras tcnicas usadas, por lo general llamadas pruebas paramtricas. 2.- Cuando es necesario usar un tamao de muestra pequeo y no es posible verificar que se cumplan ciertas suposiciones clave. 6
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA 3.- Cuando se necesita convertir datos cualitativos a informacin til para la toma de decisiones. Existen muchos casos en los que se recogen datos medidos en una escala nominal u ordinal. Muchas aplicaciones de negocios involucran opiniones o sentimientos y esos datos se usan de manera cualitativa. Las pruebas no paramtricas tienen varias ventajas sobre las pruebas paramtricas: 1.- Por lo general, son fciles de usar y entender. 2.- Eliminan la necesidad de suposiciones restrictivas de las pruebas paramtricas. 3.- Se pueden usar con muestras pequeas. 4.- Se pueden usar con datos cualitativos. Tambin las pruebas no paramtricas tienen desventajas: 1.- A veces, ignoran, desperdician o pierden informacin. 2.- No son tan eficientes como las paramtricas. 3.- Llevan a una mayor probabilidad de no rechazar una hiptesis nula falsa (incurriendo en un error). Las pruebas no paramtricas son pruebas estadsticas que no hacen suposiciones sobre la constitucin de los datos de la poblacin. Por lo general, las pruebas paramtricas son mas poderosas que las pruebas no paramtricas y deben usarse siempre que sea posible. Es importante observar, que aunque las pruebas no paramtricas no hacen
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA suposiciones sobre la distribucin de la poblacin que se muestrea, muchas veces se apoyan en distribuciones muestrales como la normal o la ji cuadrada. En estas tcnicas, solamente se necesitan conocimientos elementales de matemticas, pues los mtodos son relativamente ms sencillos que en las pruebas paramtricas. En estas pruebas, tambin se tienen supuestos, pero son pocos y no tienen que ver con la naturaleza de la distribucin de la poblacin, por lo que a estas tcnicas tambin se les conoce como de libre distribucin. Una limitacin que tienen es que no son aplicables a casos en los que se desean manejar muchas variables al mismo tiempo, para estos casos, s se requerira una prueba paramtrica; lo que s se requiere y en general es el supuesto que se debe cumplir en la mayora de las pruebas no paramtricas para confiar en ellas, es que la muestra haya sido seleccionada en forma probabilstica. Adems del problema de los supuestos, algunos experimentos o estudios que se deseen realizar producen respuestas que no es posible evaluar con la escala que tiene ms ventajas, por ejemplo, cuando los datos solamente se encuentran en una escala ordinal como cuando se evalan las habilidades de los vendedores de semillas o productos fitosanitarios, o el atractivo de cinco variedades de plantas de meln, o la preferencia por sopas de cinco marcas diferentes. En general aspectos como la habilidad o preferencias de un producto o alimento, solamente los podemos ordenar; resultados de este tipo se presentan frecuentemente en estudios de mercado y en otros del campo de las ciencias sociales. Seguidamente se analizan varias de las pruebas o mtodos estadsticos no paramtricos como Prueba de la mediana, Prueba Kuskal-Wallis, Prueba de Friedman, Concordancia de Kendall, de estas pruebas se mencionarn sus principales caractersticas y aplicaciones, adems de la prueba paramtrica a la que podran sustituir en caso necesario, as como los supuestos en los que 8
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA se basa la prueba, que como se podr ver, son menos rigurosos que para las pruebas paramtricas. 2.- PRUEBA DE LA MEDIANA La prueba de la mediana es una prueba no paramtrica que podemos considerar un caso especial de la prueba de chi-cuadrado, pues se basa en esta ltima. Su objetivo es comparar las medianas de dos muestras y determinar si pertenecen a la misma poblacin o no. Para ello, se calcula la mediana de todos los datos conjuntamente. Despus, se divide cada muestra en dos subgrupos: uno para aquellos datos que se siten por encima de la mediana y otro para los que se siten por debajo. La prueba de chi-cuadrado, descrita seguidamente determinar si las frecuencias observadas en cada grupo difieren de las esperadas con respecto a una distribucin de frecuencias que combine ambas muestras. Esta considerada prueba de chi-cuadrado (pronunciado "ji-cuadrado") es
tambin como una prueba no paramtrica que mide la
discrepancia entre una distribucin observada y otra terica (bondad de ajuste), indicando en qu medida las diferencias existentes entre ambas, de haberlas, se deben al azar. Tambin se utiliza para probar la independencia de dos muestras entre s, mediante la presentacin de los datos en tablas de contingencia. La frmula que da el estadstico es la siguiente:
Los grados de libertad vienen dados por: gl= (r-1)(k-1). Donde r es el nmero de filas y k el de columnas. 9
Criterio de decisin:
Se acepta H0 cuando rechaza.
< ( )( ). En caso contrario se
Donde t representa el valor proporcionado por las tablas, segn el nivel de significacin elegido. Cuanto ms se aproxima a cero el valor de chi-cuadrado, ms ajustadas estn ambas distribuciones. Esta prueba de la mediana est especialmente indicada cuando los datos sean extremos o estn sesgados. Ejemplo: En los experimentos de Mendel con guisantes, observ 315 lisos y amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes. De acuerdo con su teora, estos nmeros deberan presentarse en la proporcin 9:3:3:1. Hay alguna evidencia que permita dudar de su teora al nivel de significacin del 0.01? Solucin: Ensayo de Hiptesis: Ho; La teora de Mendel es acertada. H1; La teora de Mendel no es correcta. El nmero total de guisantes es 315+108+101+32=556. Puesto que los nmeros esperados estn el la proporcin 9:3:3:1 (9+3+3+1=16), se esperara:
10
lisos y amarillos
lisos y verdes
rugosos y amarillos
rugosos y verdes Grados de libertad = k-1-m = 4-1-0 = 3 No se tuvo que calcular ningn parmetro para obtener las frecuencias esperadas.
Regla de decisin: Si X2R 11.3 no se rechaza Ho.
Si X2R >11.3 se rechaza Ho. Clculos:
Justificacin y decisin:
11
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA Como 0.470 es menor que 11.3 no se rechaza Ho y se concluye con un nivel de significacin de 0.01 que la teora de Mendel es correcta. Como el valor de 0.470 est cercano a cero, se procede a hacer un ensayo unilateral izquierdo: Ensayo de Hiptesis: Ho; La teora de Mendel es acertada. H1; La teora de Mendel es muy acertada.
Regla de decisin: Si X2R 0.115 no se rechaza Ho.
Si X2R < 0.115 se rechaza Ho. Como el valor de 0.470 no es menor a 0.115 se concluye que el experimento o la teora de Mendel solo es buena. 3.- PRUEBA KUSKAL-WALLIS En estadstica, el test de Kruskal-Wallis (de William Kruskal y W. Allen Wallis) es un estadstico no paramtrico para testar si un grupo de datos proviene de la misma poblacin. Intuitivamente, es idntico al ANOVA con los datos reemplazados por categoras. Es una extensin del test de la U de MannWhitney para 3 o ms grupos.
12
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA Ya que es un test no paramtrico, el test de Kruskal-Wallis no asume normalidad en los datos, en oposicin al tradicional ANOVA. Si asume bajo la hiptesis nula que los datos vienen de la misma distribucin. Una forma comn en que se viola este supuesto es con datos heterocedsticos. Mtodo 1. Ordenar todos los datos de la muestra de menor a mayor, y asignar al menor un rango de 1, al segundo un 2, y as hasta el n-simo. Si existen datos que se repiten, se asigna el rango promedio a cada uno de ellos (si existen cuatro datos idnticos que ocupan los rangos 11, 12, 13 y 14, se les asigna un rango de 12,5 a los cuatro). 2. El estadstico est dado por:
, donde: ng es el nmero de observaciones en el grupo g rij es el rango (entre todas las observaciones) de la observacin j en el grupo i N es el nmero total de observaciones entre todos los grupos
, es el promedio de rij.
Ntese que el denominador de la expresin para K es exactamente . Luego
13
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA 3. Se puede realizar una correccin para los valores repetidos dividiendo K por , donde G es el nmero de grupos de diferentes
rangos repetidos, y ti es el nmero de observaciones repetidas dentro del grupo i que tiene observaciones repetidas para un determinado valor. Esta correccin hace cambiar a K muy poco a menor que existan un gran nmero de observaciones repetidas. 4. Finalmente, el p-value es aproximado por cuadrado. Ejemplo: Se tienen los siguientes datos experimentales, correspondientes a 22 plntulas de tomate de los que se ha recogido informacin de dos variables: una variable explicativa Exp nominal y otra variable respuesta Rta cuantitativa. Los datos se presentan de forma que en las filas hay varios individuos para facilitar la lectura: Rta Exp Rta Exp 15 15 25 25 25 33 43 15 1 1 1 1 1 1 1 2 28 28 28 35 43 13 15 25 2 2 2 2 2 3 3 3 Rta Exp Rta Exp 16 16 25 28 2 2 2 2 25 35 3 3 . Si algn ni
es pequeo ( < 5) la distribucin de K puede ser distinta de la chi-
Calcular la prueba de Kruskal-Wallis de comparacin de medianas para los datos anteriores.
14
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA Clculo de los rangos para cada observacin Para cada observacin se le asigna el rango segn el orden que ocupa la observacin en el conjunto total de los datos, asignando el rango medio en caso de empates: Rta Exp 15 15 25 25 25 33 43 15 16 16 25 28 1 1 1 1 1 1 1 2 2 2 2 2 Rango (Rta) 3.5 3.5 10.5 10.5 10.5 18 21.5 3.5 6.5 6.5 10.5 15.5 Rta Exp 28 28 28 35 43 13 15 25 25 35 2 2 2 2 2 3 3 3 3 3 Rango (Rta) 15.5 15.5 15.5 19.5 21.5 1.0 3.5 10.5 10.5 19.5
Clculo de la suma de rangos Rm Para cada grupo m = 1,,r, siendo r el nmero de grupos, se define Rm como la suma de rangos de cada grupo m, que para los datos del ejemplo resultan ser: R 1 = rangos= 3,5+3,5 +10,5 +10,5 +10,5 +18 +21,5 =78.00
grupo1
R 2 = rangos = 3,5+6,5 +6,5 +10,5 +15,5 +15,5 +15,5 +15,5 +19,5 +21,5 =130.00
grupo2
R 3 = rangos = 1+ 3,5+10,5 +10,5 +19,5 =45.00

grupo3
15
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA Clculo del valor medio de los rangos E[Rm] y de los rangos medios R m
E Rm = nm (n + 1) / 2
[ ]
y el rango medio R m como:

Rm = Rm / n m
Para los datos del ejemplo resultan ser:

E [R1 ] = n1 (n + 1) / 2 = 7 * (22 + 1) / 2 = 80,50 E [R2 ] = n2 (n + 1) / 2 = 10 * (22 + 1) / 2 = 115,50
E [R3 ] = n3 (n + 1) / 2 = 5 * (22 + 1) / 2 = 57,50
R1 = R1 / n1 = 11,14 R2 = R2 / n 2 = 13,00
R3 = R3 / n3 = 9,00
Estadstico de contraste H El estadstico de contraste H se calcula como:

2 r k H ' = 12 / n(n + 1) (1 / nm )[Rm E [Rm ]] R / 1 d 3 d j / n 3 n j m =1 j =1
siendo dj el nmero de empates en j = 1,,k siendo k el nmero de valores distintos de la variable respuesta, que para los datos del ejemplo resulta ser:
(d
k j =1
3 j
d j = 4 3 4 + 2 3 2 + 6 3 6 + 4 3 4 + 2 3 2 + 2 3 2 = 348
) (
) (
) (
) (
) (
) (
con lo que:
H ' = (12 / 22 * 23) 1 / 7(78 80,5) + 1 / 10(130 115) + 1 / 5(45 57,5) / 1 348 / 22 3 22
2 2 2
][ (
))]] = 1,3398
16
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA que sigue una distribucin Chi-Cuadrado con r 1 = 2 grados de libertad, que tiene asociada un p-valor de 0.5118 4.- PRUEBA Q DE COCHRAN Prueba o Test de la Q de Cochran permite efectuar un test estadstico para ver si existe una diferencia significativa entre tests realizados. Se trata de un contraste de H0 de que varias variables dicotmicas relacionadas tienen igual media. Las variables se miden en el mismo individuo o en individuos relacionados. Es una extensin de la prueba de McNemar para k muestras. El estadstico Q se calcula con:
= ( )[(
con n 1 grados de libertad.
] [
Este estadstico tiene aproximadamente una distribucin Chi-cuadrado
Cuando se tiene el caso de N individuos de un palmeral, a cada una de los cuales se le efectu un tratamiento con n materias activas diferentes para la erradicacin del picudo (n > 1), se tiene el caso de mediciones repetidas en la misma planta. Esto es un total de n valores apareados para cada palmera. Los resultados de cada test se pueden expresar como sano o enfermo, (+) o (-) etc. Lo mismo ocurre cuando n ingenieros agrnomos opinan sobre N variedades de una misma especie. Suponiendo que la magnitud plaga del picudo es X, entonces el valor Xij corresponde la palmera i tratada con la materia activa j. Los resultados obtenidos se pueden expresar como se hace en la Tabla siguiente:
17
Tabla: N palmeras tratadas con n materias activas

Palmeras 1 2 3 i N Total Mat activa 1 X11 X21 X31 Xi1 XN1 T.1 Mat activa 2 X12 X22 X32 Xi2 XN2 T.2 Mat active j X1j X2j X3j Xij XNj T.j Mat activa n X1n X2n X3n Xin XNn T.n Total T1 T2 T3. Ti. TN. T
Donde como convencin se adopta X = 0 cuando es (+) y X = 1 cuando es (-) entonces los valores observados son una serie de ceros y unos. Definiendo las sumatorias:
=
=
: El total de la columna j.
=
= =
El total de todas las
observaciones
=
=
: El total de la fila i.
= (
=
: La suma de los cuadrados de las filas.
= (
=
:La suma de los cuadrados de las columnas.
Entonces se puede efectuar un test estadstico para ver si existe una diferencia significativa entre los distintos tratamientos fitosanitarios llamado: La prueba Q de Cochran. El estadstico Q que se calcula con:
18
= [( )[(
con n 1 grados de libertad. Ejemplo:
)( )
]] [
],
como
ya
hemos dicho, que tiene aproximadamente una distribucin Chi-cuadrado
Se han examinado 12 palmeras a las que se les aplicado tres materias activas diferentes para el tratamiento del picudo rojo. Si los resultados se informan como (+) y (-) detectar si hay diferencias significativas entre las tres tratamientos fitosanitarios empleados. Usando la convencin de 1 para los (+) y 0 para los (-) result: Palmera 1 2 3 4 5 6 7 8 9 10 11 12 Total Mat. activa 1 1 0 1 1 1 0 1 0 1 0 0 1 7 Mat. activa 2 1 0 1 0 1 0 1 0 1 0 1 0 6 Mat activa 3 0 0 1 1 1 1 1 0 0 1 0 1 7 Total 2 0 3 2 3 1 3 0 2 1 1 2 20
=
= =
= (
= (
=
) =
+
+ +
=
=
=
) = ( )[( = <
] [
19
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA La conclusin es que no se han encontrado diferencias significativas entre los tres mtodos. 5.- F DE FRIEDMAN La prueba de Friedman es el equivalente a la prueba ANOVA para dos factores en la versin no paramtrica. El mtodo consiste en ordenar los datos por filas o bloques, reemplazndolos por su respectivo orden. Al ordenarlos, debemos considerar la existencia de datos idnticos. Mtodo Sea una tabla de datos, donde m son las filas (bloques) y n las
columnas (tratamientos). Una vez calculado el orden de cada dato en su bloque, reemplazamos la tabla original con otra el orden de xij en cada bloque i. 1. Clculo de las varianzas intra e inter grupo: donde el valor rij es
2. 3.
El estadstico viene dado por El criterio de decisin es
. .
20
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA Ejemplo: Se conduce un estudio de campo con fresas (Fragaria x ananassa) para determinar la eficacia de seis herbicidas en el control de malezas gramneas. Las gramneas fueron contadas dentro de cada tratamiento y examinadas con ANAVA. Las medias de los tratamientos fueron separadas utilizando la prueba de diferencia mnima significativa (DMS) de Fisher al 5% de significancia (tomado de Gilreath et al., 2003). ANAVA Prueba de Friedman ANAVA
Herbicidas Nmero de Herbicidas Nmero de Herbicidas Nmero gramneas Medias 1 6 5 2 4 3 90.7 a* 39.5 b 30.3 b 28.5 b 10.5 b 5.10 b 1 6 5 2 4 3 gramneas Medianas 40 a 17 b 16 b 14 b 4c 3c 4 3 5 6 2 1 de frutos Medias 776.7 a 763.5 a 689.0 b 661.8 b 651.6 b 545.5 c
*Valores seguidos por la misma letra no difieren al 5% de significancia segn DMS. Claramente, los datos de rendimiento expresados en nmero de frutos cosechados lucen razonables. Los tratamientos que recibieron los herbicidas 3 y 4 tuvieron los mayores rendimientos, seguidos por los herbicidas 2, 5 y 6. Sin embargo, los resultados del ANAVA para los conteos de malezas gramneas no ofrecen mucha informacin que concuerde con los datos de rendimiento.
21
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA Cmo se puede explicar que 39.5 gramneas en promedio sean
estadsticamente igual a 5.1? La respuesta yace en la gran variabilidad inicial que exista en la distribucin de las gramneas en el campo bajo estudio, la cual violaba los supuestos de normalidad y de homogeneidad de varianza, como lo expresan las pruebas de Shapiro-Wilk (p<0.0001) para normalidad y de Bartlett para homogeneidad de varianzas (p=0.0023). Cuando los mismos datos de enmalezamiento fueron sometidos a la prueba de Friedman, los resultados indicaron que los tratamientos con menos malezas gramneas fueron los de mayor rendimiento. Este ejemplo, adems compara el uso de mtodos paramtricos y no paramticos.
6.- CONCORDANCIA DE KENDALL Anlisis de la concordancia en la valoracin de aspectos (coeficiente de Kendall). Despus de obtener una proposicin final en la consulta a los expertos agrnomos necesitamos demostrar su confiabilidad, debemos probar el nivel de acuerdo entre los expertos para otorgar mayor autenticidad a nuestro estudio, es preciso comprobar el grado de coincidencia de las valoraciones realizadas por lo expertos. Podemos utilizar entonces el Coeficiente de Concordancia de Kendall, que constituye un estadgrafo muy til en estudios de confiabilidad entre expertos de una materia, en este caso agronmica, al determinar la asociacin entre distintas variables. Es una medida de coincidencia entre ordenaciones que pueden ser objetos o individuos. En este caso el coeficiente concordancia (W) ser un ndice de la divergencia del acuerdo efectivo entre los expertos mostrado en los datos del mximo acuerdo posible (perfecto).
22
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA Para la aplicacin del Coeficiente de Concordancia de Kendall (W), se construye una tabla Aspectos a evaluar / Expertos donde se asientan en una tabla los rangos de valoracin (en trminos numricos, 1 a 5) asignados a cada aspecto evaluado contra cada uno de los expertos, siempre tomando los datos a partir de la tabla que se uso en el mtodo Delphi, o sea, la tabla de Aspectos / Rangos de Valoracin donde se encuentran los criterios de los expertos y los rangos de valoracin. Aspectos a Experto 1 Evaluar 1 2 3 Experto 2 Experto 3 Ultimo Experto
A partir de aqu se sigue la metodologa establecida: Determinacin de la suma de los valores numricos asignados a cada aspecto a evaluar, segn la apreciacin del experto (Rj) Determinacin del valor medio de las Rj, dada por la sumatoria de los Rj entre N, total de aspectos a evaluar. Determinacin de la desviacin media, dada por la diferencia entre cada Rj y el valor de la media. Determinacin de la suma de los cuadrados de las desviaciones medias, S. Determinacin del cuadrado del nmero total de expertos, K. Determinacin del cubo del nmero total de aspectos a evaluar, N. Determinacin de la diferencia entre el cubo de N y N y su multiplicacin por el cuadrado de K. Determinacin del estadgrafo que responde a la siguiente expresin:
23
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA En la prueba estadstica Coeficiente de Concordancia de Kendall (W), el coeficiente W ofrece el valor que posibilita decidir el nivel de concordancia entre los expertos. El valor de W oscila entre 0 y 1. El valor de 1 significa una concordancia de acuerdos total y el valor de 0 un desacuerdo total. Obviamente la tendencia a 1 es lo deseado pudindose realizar nuevas rondas si en la primera no es alcanzada significacin en la concordancia. Conclusiones. Podemos concluir que el mtodo de expertos agronmicos, su procesamiento a travs del mtodo Delphi y la verificacin de concordancia a travs del estadgrafo de correlacin de Kendall, tiene una serie de ventajas y desventajas dentro de los mtodos bsicos de anlisis cualitativos. Ventajas: Se basa en la suposicin de que varios expertos pueden llegar a un mejor pronstico que una sola persona. No existe secreto y se fomenta la comunicacin porque a veces los pronsticos y validaciones tienen influencia de factores sociales y pueden no reflejar un consenso. Como pronstico visionario es una profeca que usa ideas y juicio personales, intuitivos, vinculados entre s. Desventajas: Se ha criticado por su poca seguridad, demasiada sensibilidad de los resultados a la ambigedad de las preguntas. Dificultad para establecer el grado de experiencia de los miembros del panel, la imposibilidad de que tome en cuenta lo inesperado y por los grandes retrasos entre las repeticiones del proceso.
24
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA Los mtodos cualitativos confan principalmente en el juicio de los expertos y tienden a ser menos precisos que los mtodos cuantitativos. A pesar de estas limitaciones y teniendo en cuenta sus cualidades positivas, su uso actual en las organizaciones e investigaciones sugiere que con frecuencia su potencial excede a sus limitaciones. As mismo el procesamiento a travs de un sistema automatizado, siempre garantiza la calidad de nuestra investigacin. Tal como hemos descrito el mtodo a seguir es el siguiente: se crean todas las combinaciones de puntos posibles [(xi, yi), (xj, yj)] tal que i j y se definen c = nmero de parejas concordantes (xi>xj y yi>yj) o (xi<xj y yi<yj) d = nmero de parejas discordantes (xi>xj y yi<yj) o (xi<xj y yi>yj) ey=nmero de ligas en y, con xixj ex=nmero de ligas en x, con yiyj, aplicando el siguiente estadstico:
( )
((
)(
))
El coeficiente de Kendall se define tal que 1 correlacin perfecta, y 0 indica no correlacin.
1 donde 1 indica
La significancia de no asociacin viene dada por una distribucin normal:
( )
= (
)
+
= (
7.- Y EN EXCEL?
)(
( ))
COMO SE HACE EN EXCEL.xls
25
26
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA BIBLIOGRAFA
Bioestadstica: Mtodos y aplicaciones Presentacin en Power Point.- Anlisis Multivariable.- Itziar Aretxaga Estadstica no paramtrica - Wikipedia, la enciclopedia libre Contraste de Kruskall-Wallis Estadstica No-Paramtrica Tesauro SPINES :: estadstica no parametrica Estadstica no paramtrica http://www.bioestadistica.freeservers.com/tema14.pdf http://spines.r020.com.ar/index.php?tema=2345&/distribuciones estadsticas Tutorial estadstica no paramtrica gratis - emagister.com Estadstica Aplicada Facultad de Agronoma USAC http://www.medmayor.cl/odontologia/quinto/bioestadistica/estadisti canoparametrica.doc Estadstica multivariante y no ... - Bsqueda de libros de Google Estadstica para administracin y ... - Bsqueda de libros de Google Estadstica matemtica con aplicaciones - Bsqueda de libros de Google http://www.redbio.org/portal/encuentros/enc_2001/minicursos/pdf/M C-01/GOIANIA-REDBIO3-CROSSA.pdf Estadstica No Paramtrica http://www.uclm.es/profesorado/mdsalvador/58109/teoria/anova_un _factor-lectura.pdf http://gcrec.ifas.ufl.edu/WeedScience/Documents/Fumigant Studies/Estad no param02.doc Diseo de experimentos. Clase 20 Anova un factor y Kruskal-Wallis Curso: Estadstica I
27
DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA BIBLIOGRAFA
Yahoo! GeoCities Pruebas para k muestras dependientes http://patoral.umayor.cl/favicon.ico Proporcin poblacional Glosario http://www.azprensa.com/favicon.ico
28

27 - Estadistica No Parametric A II

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

27 - Estadistica No Parametric A II

Cargado por

Copyright:

Formatos disponibles

DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA

AUTOR: Irene Guilln Luna Curso 2007/08

DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA

1.- INTRODUCCIN A LA ESTADSTICA NO PARAMTRICA

2.- PRUEBA DE LA MEDIANA

3.- PRUEBA KUSKAL-WALLIS

6.- CONCORDANCIA DE KENDALL

AUTOR: Irene Guilln Luna Curso 2007/08

DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA

AUTOR: Irene Guilln Luna Curso 2007/08

AUTOR: Irene Guilln Luna Curso 2007/08

DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA

AUTOR: Irene Guilln Luna Curso 2007/08

AUTOR: Irene Guilln Luna Curso 2007/08

AUTOR: Irene Guilln Luna Curso 2007/08

AUTOR: Irene Guilln Luna Curso 2007/08

tambin como una prueba no paramtrica que mide la

AUTOR: Irene Guilln Luna Curso 2007/08

DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA

Se acepta H0 cuando rechaza.

< ( )( ). En caso contrario se

AUTOR: Irene Guilln Luna Curso 2007/08

DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA

Regla de decisin: Si X2R 11.3 no se rechaza Ho.

Si X2R >11.3 se rechaza Ho. Clculos:

AUTOR: Irene Guilln Luna Curso 2007/08

Regla de decisin: Si X2R 0.115 no se rechaza Ho.

AUTOR: Irene Guilln Luna Curso 2007/08

Ntese que el denominador de la expresin para K es exactamente . Luego

AUTOR: Irene Guilln Luna Curso 2007/08

es pequeo ( < 5) la distribucin de K puede ser distinta de la chi-

Calcular la prueba de Kruskal-Wallis de comparacin de medianas para los datos anteriores.

AUTOR: Irene Guilln Luna Curso 2007/08

R 3 = rangos = 1+ 3,5+10,5 +10,5 +19,5 =45.00

AUTOR: Irene Guilln Luna Curso 2007/08

y el rango medio R m como:

Para los datos del ejemplo resultan ser:

E [R3 ] = n3 (n + 1) / 2 = 5 * (22 + 1) / 2 = 57,50

Estadstico de contraste H El estadstico de contraste H se calcula como:

AUTOR: Irene Guilln Luna Curso 2007/08

Este estadstico tiene aproximadamente una distribucin Chi-cuadrado

AUTOR: Irene Guilln Luna Curso 2007/08

DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA

Tabla: N palmeras tratadas con n materias activas

El total de todas las

: La suma de los cuadrados de las filas.

:La suma de los cuadrados de las columnas.

AUTOR: Irene Guilln Luna Curso 2007/08

DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA

hemos dicho, que tiene aproximadamente una distribucin Chi-cuadrado

AUTOR: Irene Guilln Luna Curso 2007/08

El estadstico viene dado por El criterio de decisin es

AUTOR: Irene Guilln Luna Curso 2007/08

AUTOR: Irene Guilln Luna Curso 2007/08

AUTOR: Irene Guilln Luna Curso 2007/08

AUTOR: Irene Guilln Luna Curso 2007/08

AUTOR: Irene Guilln Luna Curso 2007/08

El coeficiente de Kendall se define tal que 1 correlacin perfecta, y 0 indica no correlacin.

La significancia de no asociacin viene dada por una distribucin normal:

COMO SE HACE EN EXCEL.xls

AUTOR: Irene Guilln Luna Curso 2007/08

DISEO DE EXPERIMENTOS: ESTADSTICA NO PARAMTRICA