P. 1
ESTADÍSTICA NO PARAMÉTRICA

ESTADÍSTICA NO PARAMÉTRICA

|Views: 7.395|Likes:
Publicado porDiego DelGt

More info:

Published by: Diego DelGt on Aug 09, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

06/04/2015

pdf

text

original

ESTADÍSTICA NO PARAMÉTRICA

1. Introducción:

Los métodos de estadística inferencial que hemos estudiado a durante el curso, son llamados métodos paramétricos porque ellos son basados en muestreos de una población con parámetros específicos, como la media ( ), la desviación estándar ( ) o la proporción (p). Estos métodos paramétricos usualmente tienen que ajustarse a algunas condiciones completamente estrictas, así como el requisito de que los dato s de la muestra provengan de una población normalmente distribuidas. Esta sección presenta los métodos no paramétricos, los cuales no tienen tales estrictos requisitos. La mayor parte de las técnicas estudiadas hacen suposiciones sobre la composición de los datos de la población. Las suposiciones comunes son que la población sigue una distribución normal, que varias poblaciones tienen varianzas iguales y que los datos se miden en una escala de intervalos o en una escala de razón. Este tema presentará un gr upo de técnicas llamadas no paramétricas que son útiles cuando estas suposiciones no se cumplen.

Las principales pruebas no paramétricas son las siguientes: y y y y y y y y y y y y y y y y y y y Prueba ² de Pearson Prueba binomial Prueba de Anderson-Darling Prueba de Cochran Prueba de Cohen kappa Prueba de Fisher Prueba de Friedman Prueba de Kendall Prueba de Kolmogórov-Smirnov Prueba de Kruskal-Wallis Prueba de Kuiper Prueba de Mann-Whitney o prueba de Wilcoxon Prueba de McNemar Prueba de la mediana Prueba de Siegel-Tukey Coeficiente de correlación de Spearman Tablas de contingencia Prueba de Wald-Wolfowitz Prueba de los signos de Wilcoxon . Su distribución no puede ser definida a priori. cuando el nivel de medida empleado no sea. ESTADÍSTICA NO PARAMÉTRICA: La estadística no paramétrica es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos. pues son los datos observados los que la determinan.2. de intervalo. como mínimo. La utilización de estos métodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribución conocida.

En estos casos se emplea como parámetro de centralización la mediana . que es aquel punto para el que el valor de X está el 50% de las veces por debajo y el 50% por encima. Las pruebas no paramétricas. En la mayor parte de ellas los resultados estadísticos se derivan únicamente a partir de procedimientos de ordenación y recuento. de manera que algunas veces son referidas como pruebas de libre distribución . por ello se conocen también como de distribución libre (distribution free). Aunque libre distribución es una descripción más exacta. Cuando trabajamos con muestras pequeñas (n < 10) en las que se desconoce si es válido suponer la normalidad de los datos. PRUEBAS NO PARAMÉTRICAS: Definición: Se denominan pruebas no paramétricas aquellas que no presuponen una distribución de probabilidad para los datos. sin embargo. por lo que su base lógica es de fácil comprensión.3. al menos para corroborar los resultados obtenidos a partir de la utilización de la teoría basada en la normal. . el término no paramétrico es más comúnmente usado. hay algunas pruebas no paramétricas que dependen de un parámetro tal como la media. conviene utilizar pruebas no paramétricas. no requieren una distribución particular. Aunque el término no paramétrico sugiere que la prueba no está basada en un parámetro.

f l il p l t l t t t t i ti i t l s é p J S s P ti p p p l p E É mé i p S s P É I S pli ti l p ti l t t i l t t . pli l ll i i ti pli p p t ti i t pli l i pl l p . i t p 2. l i ti i .El i l p p ti : 4. p 3. i p l ti i it l . l t t . E . if J S Y ESVE j s t it p ti t f l t p t i t . p . t l ti í i t t . VE V .

. pero la reducción de eficiencia puede ser compensada por un aumento en el tamaño de la muestra. .De ventaja de lo M todo No Paramétrico 1. las pruebas no paramétricas son generalmente menos eficientes que sus contrapartes paramétricas. Cuando los requisitos de la distribución de una población son satisfechos. Las pruebas no paramétricas no son tan eficientes como las pruebas paramétricas. Los métodos no paramétricos tienden a perder información porque datos numéricos exactos son frecuentemente reducidos a una forma cualitativa. de manera que con una prueba no paramétrica generalmente se necesita evidencia más fuerte (así como una muestra más grande o mayores diferencias) antes de rechazar una hipótesis nula.

‡ Dos posibles alternativas: ± ANOVA ± Prueba de Friedman ANOVA Friedman te t ‡ Método estadístico habitual. debemos considerar la existencia de datos idénticos. Al ordenarlos. 5. ‡ Es la versión no-paramétrica del ANOVA. ‡ La violación de las condiciones tiene un gran efecto en el post-hoc test. ± Requiere que las variables aleatorias tengan igual varianza. DEFINICION En estadística la prueba de Friedman es una prueba no paramétrica desarrollado por el economista Milton Friedman. parte de la hipótesis nula se rechaza debido a la aleatoriedad (Salzberg97).2. ‡ Condiciones: ± Distribución normal. ‡ ¿Se cumplen las condiciones impuestas por ANOVa? ± SI => Utilizar ANOVA. ‡ Utilizar la modificación de Iman y Davenport (1980) al ser un mejor estadístico (menos conservativo). ‡ Cuando se hacen muchos test. .5. reemplazándolos por su respectivo orden. ‡ La naturaleza de los datos no da pistas sobre la satisfacción de la condición anterior. el método consiste en ordenar los datos p or filas o bloques. PRUEBA DE FRIEDMAN 5. ± NO => Utilizar Friedman test.1. Equivalente a la prueba ANOVA para dos factores en la versión no paramétrica. Comparación de vario cla ificadore ‡ Los métodos anteriores no fueron diseñados para la media de varias variables.

PRUEBA DE FRIEDMAN Esta prueba puede utilizarse en aquellas situaciones en las que se seleccionan n grupos de k elementos de forma que los elementos de cada grupo sean lo más parecidos posible entre sí.... Hipótesis alternativa (H1): Hay diferencias entre los grupos......... xnk .. .. j x1j .. n 1 x11 . .3. frente a la hipótesis alternativa de que por lo menos la distribución de una de las respuestas difiere de las demás... xi1 .. Para poder utilizar esta prueba las respuest as deben ser variables continuas y estar medidas por lo menos en una escala ordinal. xik ... xn2 . . k x1k .. ........... o bien cuando a cada uno de los elementos de una muestra de tamaño n se le aplican los k ''tratamientos''.. i .. xij .. ...... xn1 2 x12 . . Los datos se disponen en una tabla en la que en cada fila se recogen las respuestas de los k elementos de cada grupo a los k tratamientos: Grupo\ Tratamiento 1 .. xnj . y a cada uno de los elementos del grupo se le aplica uno de entre k ''tratamientos''.....5. ... .. Hipótesis: Hipótesis nula (H0): No existen diferencias entre los grupos. MUESTRAS RELACIONADAS. . xi2 . . La hipótesis nula que se contrasta es que las respuestas asociadas a cada uno de los ''trat amientos'' tienen la misma distribución de probabilidad o distribuciones con la misma mediana...

de forma que se rechaza la hipótesis nula para valores de superiores al valor crítico para el nivel de significación fijado.A las observaciones de cada fila se les asignan rangos de menor a mayor desde 1 hasta k. la distribución de los rangos en cada fila se debe al azar. y es de esperar que la suma de los rangos correspondientes a cada columna sea aproximadamente igual a n(k + 1)/ .1 grados de libertad. Si la hipótesis nula es cierta. El estadístico de prueba es:                     Si Ho es cierta y el número de columnas y/o de filas es moderadamente grande la distribución de F se aproxima a una chi-cuadrado con k . siendo RJ la suma correspondiente a la columna j-ésima. a continuación se suman los rangos correspondientes a cada columna. . La prueba de Friedman determina si las RJ observadas difieren significativamente del valor esperado bajo la hipótesis nula.

Efectuar la sumatoria de los rangos en funci ón de las columnas Rc y elevarlos al cuadrado Rc . Sirve para establecer diferencias.5. Ordenar las observaciones en función de los cambios advertidos después del tratamiento o tratamientos. Pasos: 1. . Comparar el valor de X r de Friedman con las tablas de valores críticos de probabilidad propia. Para muestras pequeñas: K = grandes: K = . cuando la muestra es pequeña. Muestras igualadas (igual número de sujetos en cada condición). Se trabaja con tablas de doble entrada. .4 y H = > 9. En caso de muestras grandes. CARACTERÍSTICAS X r Se utiliza cuando: y y y y y   Trabaja con datos ordinales. Aplicar la fórmula de análisis de varianza de doble entrada por rangos de Friedman. Asignar rangos del dato más pequeño al mayor en función de las hileras.9. utilizar las tablas de valores críticos de ji cuadrada de Pearson. Las muestras son sacadas de la misma población.4. para muestras y y y y Asignar al azar a los sujetos a cada condición. 4. Se utiliza para más de tres tratamientos. Se asignan rangos por condición. .4 y H = . 5.     .

la prueba más idónea es el análisis de la varianza de dos clasificaciones por rangos de Friedman.5. En primer lugar. La asociación de padres de un centro convoca sucesivamente tres reuniones dirigidas a los padres de alumnos de un mismo grupo o clase. Dado que el número de sujetos es pequeño.05) Tema A 3 3 3 2 3 3 Tema B Tema C 1 1 1 1 1 1 SOLUCIÓN. y la part icipación de los padres en el centro (Tema C).5. E ERCICIOS: 1. El estadístico de contraste que emplearemos será: . en las que se abordaron respectivamente temas relacionados con el apoyo de la familia al estudio (Tema A). plantea remos las hipótesis: H0: No existen diferencias entre en la atracción a los tres temas. H1: Existen diferencias significativas entre en la atracción a los tres temas. Si contamos los datos de asistencia a cada una de las tres reuniones para los padres de alumnos de 6 clases. y puesto que los casos se hayan relacionados. ¿podemos afirmar que los tres temas atrajeron de modo distinto a los convocados? ( = 0. deberemos utilizar una prueba no paramétrica. el juego y el tiempo libre de los niños (Tema B).

teniendo en cuenta que X sigue una distribución de chi cuadrado con k -1 grados de libertad. ¡ = 5. el valor crítico será ¡ 0. por lo que podemos rechazar con una confianza del 95% que existen diferencias significativas en cuanto a la atracción a los distintos temas. Sustituyendo: Comparamos el valor observado con el que nos ofrece la tabla.Por lo tanto.991 . Por tanto. R B = 1 y RC = 7. calcularemos la suma de rangos para cada columna:  Tema A 3 3 3 2 3 3 Tema B Tema C 1 1 1 1 1 1 RA = 17. aquél entra en la región de rechazo.95 Puesto que el valor observado es mayor que el crític o.

8.2. se acepta Ho y se rechaza Ha. después de aplicar 3 diferentes tipos de tratamiento. No hay diferencia significativa en niños de 4. Para todo valor de probabilidad mayor que 0. El modelo experimental tiene tres o más muestras dependientes.05. Escala = 0 . 10 y 12 años después de 3 diferentes tratamientos. Hay diferencia significati va en niños de 4. 6.05. después de aplicar 3 diferentes tipos de tratamiento. Nivel de significación. Un investigador desea comparar los niveles de memoria en niños de 4. Zona de rechazo. Elección de la prueba estadística. 8. Hipótesis nula (Ho). 6. 6. Véase: Flujograma 5 SOLUCION Planteamiento de la hipótesis.20 . se acepta Ha y se rechaza Ho. 10 y 12 años. Para todo valor de probabilidad igual o menor que 0. 8. y y Hipótesis alterna (Ha). 10 y 12 años.

Por otro lado. se acepta que entre los tres tratamientos ex isten distintos grados de memoria adquirida. esto indica que es menor que el nivel de significancia. Las cifras aproximadas al estadístico calculado 2. Se utiliza la tabla N para pruebas pequeñas.8 = 0. Aceptada Ha. Interpretación. por lo cual. en función de las hileras. se acepta Ha y se rechaza Ho. Transformamos los valores en rangos de acuerdo con la prueba de Friedman. el tratamiento B ofrece mayores ventajas para la adquisición de memoria . la probabilidad es de 0. Se distingue notoriamente que el tratamiento A es menos eficaz.367. Al valor más bajo le corresponde el rango 1. Decisión. Como el valor de X 2r calculado es igual a 2.367. Rango1 = 8 Rango2 = 9 Rango3 =13 Calculamos la X2r de Friedman. con respecto a los otros dos tratamientos. respetando el orden hasta el dato que tiene la cifra más alta.Aplicación de la prueba estadística.8. Con tres columnas y cinco hileras se compara el valor calculado de X2r de Friedman con la tabla correspondiente de distribución de probabilidad.

.

es/metodos-de-investigacion-y-diagnostico-eneducacion/analisis-de-datos-en-la-investigacioneducativa/Bloque_II/page_95.pe/~fmendiburu/index-filer/academic/metodos1.rincondelvago.com/ED800Estadisticas_no_parametricas.us.htm/ y .com/prueba_no_parametrica www.edu.5.htm http://ocwus. http://tarwi.wikipedia.com/estadistica_no_parametrica www.6.lamolina.monografias. y y y y BIBLIOGRAFÍA www.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->