Estadistica Inferencial

Instituto Tecnolgico de Colima
Ingeniera en gestin empresarial
Estadistica inferencial 1
Estadistica parametrica y no parametrica
Prof. J. Jess Castrejon Romn
Hctor Manuel Velasco Pea
Aula t 7
1
Feb. /2012
INTRODUCCIN Partiendo de la base de que algunos contrastes de hiptesis dependen del supuesto de normalidad, muchos de estos contrastes siguen siendo aproximadamente vlidos cuando se aplican a muestras muy grandes, incluso si la distribucin de la poblacin no es normal. Sin embargo, muchas veces se da tambin el caso de que, en aplicaciones prcticas, dicho supuesto de normalidad no sea sostenible. Lo deseable entonces ser buscar la inferncia en contrastes que sean vlidos bajo un amplio rango de distribuciones de la poblacin. Tales contrastes se denominan no paramtricos. En este tema intentar describir contrastes no paramtricos que son apropiados para analizar algunos de los problemas que hubiera podido encontrar antes. Los contrastes no paramtricos son generalmente, vlidos cualquiera que sea la distribucin de la poblacin. Es decir, dichos contrastes pueden ser desarrollados de manera que tengan el nivel de significacin requerido, sin importar la distribucin de los miembros de la poblacin. Mi objetivo, es dar una idea general de aquellos mtodos que son mas utilizados. As, en el presente tema tratar procedimientos no paramtricos para contrastar la igualdad de los parmetros de centralizacin de dos distribuciones poblacionales. La mayor parte de las tcnicas estudiadas hacen suposiciones sobre la composicin de los datos de la poblacin. Las suposiciones comunes son que la poblacin sigue una distribucin normal, que varias poblaciones tienen varianzas iguales y que los datos se miden en una escala de intervalos o en una escala de razn. Este tema presentar un grupo de tcnicas llamadas no pramtricas que son tiles cuando estas suposiciones no se cumplen.
DESARROLLO
La estadstica paramtrica es una rama de la estadstica inferencial que comprende los procedimientos estadsticos y de decisin que estn basados en las distribuciones de los datos reales. Estas son determinadas usando un nmero finito de parmetros. Esto es, por ejemplo, si conocemos que la altura de las personas sigue una distribucin normal, pero desconocemos cul es la media y la desviacin de dicha normal. La media y la desviacin tpica de la desviacin normal son los dos parmetros que queremos estimar. Cuando desconocemos totalmente que distribucin siguen nuestros datos entonces deberemos aplicar primero un test no paramtrico, que nos ayude a conocer primero la distribucin. La mayora de procedimientos paramtricos requiere conocer la forma de distribucin para las mediciones resultantes de la poblacin estudiada. Para la inferencia paramtrica es requerida como mnimo una escala de intervalo, esto quiere decir que nuestros datos deben tener un orden y una numeracin del intervalo. Es decir nuestros datos pueden estar categorizados en: menores de 20 aos, de 20 a 40 aos, de 40 a 60, de 60 a 80, etc, ya que hay nmeros con los cuales realizar clculos estadsticos. Sin embargo, datos categorizados en: nios, jvenes, adultos y ancianos no pueden ser interpretados mediante la estadstica paramtrica ya que no se puede hallar un parmetro numrico (como por ejemplo la media de edad) cuando los datos no son numricos. Es la que requiere que los elementos que integran las muestras contengan elementos parmetros o medibles. Puede resolver tres tipos de problemas:

Estimacin puntual: En la que pretendemos darle un valor al parmetro a estimar. Estimacin por intervalos (buscamos un intervalo de confianza). Contraste de hiptesis, donde buscamos contrastar informacin acerca del parmetro.
ESTADISTICA NO PARAMETRICA
La estadstica no paramtrica es una rama de la estadstica que estudia las pruebas y modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su distribucin no puede ser definida a priori, pues son los datos observados los que la determinan. La utilizacin de estos mtodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribucin conocida, cuando el nivel de medida empleado no sea, como mnimo, de intervalo. Las principales pruebas no paramtricas son las siguientes:

Prueba de Pearson Prueba binomial Prueba de Anderson-Darling Prueba de Cochran Prueba de Cohen kappa Prueba de Fisher Prueba de Friedman Prueba de Kendall Prueba de Kolmogrov-Smirnov Prueba de Kruskal-Wallis Prueba de Kuiper Prueba de Mann-Whitney o prueba de Wilcoxon Prueba de McNemar Prueba de la mediana Prueba de Siegel-Tukey Coeficiente de correlacin de Spearman Tablas de contingencia Prueba de Wald-Wolfowitz Prueba de los signos de Wilcoxon
La mayora de estos test estadsticos estn programados en los paquetes estadsticos ms frecuentes, quedando para el investigador, simplemente, la tarea de decidir por cul de todos ellos guiarse o qu hacer en caso de que dos test nos den resultados opuestos. Hay que decir que, para poder aplicar cada uno existen diversas hiptesis nulas que deben cumplir nuestros datos para que los resultados de aplicar el test sean fiables. Esto es, no se puede aplicar todos los test y quedarse con el que mejor convenga para la investigacin sin verificar si se cumplen las
4
hiptesis necesarias. La violacin de las hiptesis necesarias para un test invalidan cualquier resultado posterior y son una de las causas ms frecuentes de que un estudio sea estadsticamente incorrecto. Esto ocurre sobre todo cuando el investigador desconoce la naturaleza interna de los test y se limita a aplicarlos sistemticamente. La mayor parte de los procedimientos de prueba de hiptesis que se presentan en las unidades anteriores se basan en la suposicin de que las muestras aleatorias se seleccionan de poblaciones normales. Afortunadamente, la mayor parte de estas pruebas an son confiables cuando experimentamos ligeras desviaciones de la normalidad, en particular cuando el tamao de la muestra es grande. Tradicionalmente, estos procedimientos de prueba se denominan mtodos paramtricos. En esta seccin se consideran varios procedimientos de prueba alternativos, llamados no paramtricos mtodos de distribucin libre, que a menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las poblaciones fundamentales, excepto que stas son continuas. Los procedimientos no paramtricos o de distribucin libre se usan con mayor frecuencia por los analistas de datos. Existen muchas aplicaciones en la ciencia y la ingeniera donde los datos se reportan no como valores de un continuo sino mas bien en una escala ordinal tal que es bastante natural asignar rangos a los datos. Un ejemplo donde se aplica una prueba no paramtrica es el siguiente, dos jueces deben clasificar cinco marcas de cerveza de mucha demanda mediante la asignacin de un grado de 1 a la marca que se considera que tiene la mejor calidad global, un grado 2 a la segunda mejor, etctera. Se puede utilizar entonces una prueba no paramtrica para determinar donde existe algn acuerdo entre los dos jueces. Se debe sealar que hay varias desventajas asociadas con las pruebas no perimtricas. En primer lugar, no utilizan la informacin que proporciona la muestra, y por ello una prueba no paramtrica ser menos eficiente que el procedimiento paramtrico correspondiente, cuando se pueden aplicar ambos mtodos. En consecuencia, para lograr la misma potencia, una prueba no paramtrica requerir la correspondiente prueba no paramtrica.
Como se indic antes, ligeras divergencias de la normalidad tienen como resultado desviaciones menores del ideal para las pruebas perimtricas estndar. Esto es cierto en particular para la prueba t y la prueba F. En el caso de la prueba t y la prueba F, el valor P citado puede ser ligeramente errneo si existe una violacin moderada de la suposicin de normalidad.
En resumen, si se puede aplicar una prueba paramtrica y una no paramtrica al mismo conjunto de datos, debemos aplicar la tcnica paramtrica ms eficiente. Sin embargo, se debe reconocer que las suposiciones de normalidad a menudo no se pueden justificar, y que no siempre se tienen mediciones cuantitativas. Las pruebas no paramtricas tienen varias ventajas sobre las pruebas paramtricas: 1.- Por lo general, son fciles de usar y entender. 2.- Eliminan la necesidad de suposiciones restrictivas de las pruebas paramtricas. 3.- Se pueden usar con muestras pequeas. 4.- Se pueden usar con datos cualitativos. Tambin las pruebas no paramtricas tienen desventajas: 1.- A veces, ignoran, desperdician o pierden informacin. 2.- No son tan eficientes como las paramtricas. 3.- Llevan a una mayor probabilidad de no rechazar una hiptesis nula falsa (incurriendo en un error de tipo II). Las pruebas no paramtricas son pruebas estadsticas que no hacen suposiciones sobre la constitucin de los datos de la poblacin. Por lo general, las pruebas paramtricas son mas poderosas que las pruebas no paramtricas y deben usarse siempre que sea posible. Es importante observar, que aunque las pruebas no paramtricas no hacen suposiciones sobre la distribucin de la
6
poblacin que se muestrea, muchas veces se apoyan en distribuciones muestrales como la normal o la ji cuadrada.
EJEMPLO 1 A una muestra aleatoria de cien nios se les pidi que comparasen dos nuevos sabores de helados: vainilla y fresa. 56 de los nios prefirieron el sabor a vainilla, 40 prefirieron el sabor a fresa, y a 4 de ellos les daba igual. Se quiere contrastar frente a una alternativa bilateral la hiptesis nula de que no existe en la poblacin una preferencia por un sabor u otro. Si p es la proporcin de nios en la poblacin que prefieren el sabor a vainilla, lo que queremos contrastar es H0: p=0,5 frente a H1: p"0,5. Como cuatro de los nios no han preferido un sabor a otro, tenemos un tamao muestral de 96 nios. La proporcin de nios que han preferido el sabor a vainilla es: Px = 56 / 96 = 0,583 Para un nivel de significacin decisin es: Px - 0,5 Rechazar H0 si -------------------- < -Z "(0,5)(0,5) / n Px - 0,5 -------------------- > -Z "(0,5)(0,5) / n En nuestro caso Px - 0,5 0,583 - 0,5 /2 /2 , la regla de
-------------------- = ------------------------ = 1,63 "(0,5)(0,5) / n "(0,5)(0,5) / 96 Vemos, que si Z /2 = 1,63, /2 = 0,0516, de manera que = 0,1032. Por tanto, la hiptesis nula podr ser rechazada para todos los niveles de significacin superiores al 10,32%. Si la hiptesis nula de que el mismo nmero de nios prefieren el sabor a vainilla que el sabor a fresa fuese cierta, la probabilidad de observar unos resultados maestrales tan extremos, o mas extremos que los actualmente obtenidos, ser ligeramente superior a uno sobre diez. En nuestro caso, los datos muestran una modesta evidencia en contra de dicha hiptesis. La figura muestra las probabilidades de las colas de una distribucin normal correspondientes al 5,16% inferior y superior del rea total bajo la funcin de densidad.
EJEMPLO 2 Como parte de un estudio sobre transferencia del aprendizaje entre tareas simples y complejas, se disea un experimento en el que cada sujeto se le presentan 5 tareas simples y a continuacin 1 tarea compleja. Al finalizar sta se le pregunta a cada sujeto si le ha parecido mas fcil o mas difcil que las 5 anteriores. Si algn sujeto contestaba igualmente difcil, se le segua preguntando hasta decidirse por mas fcil o mas difcil . Las respuestas dadas por los 10 sujetos fueron: SUJETO 1 2 3 4 5 6 7 8 9 10
RESPUESTA D F F D F F F D F F Podemos concluir que ha habido transferencia, a un nivel de significacin de 0,01 ? Siendo D (Mas difcil = - ) y F = + -) " (No ha habido transferencia) H1: P (-) < (Ha habido transferencia) bajo H0 p (-) es constante por cada sujeto.
(3 + 0,5) - (10 / 2) Z = ---------------------------- = -0,949 " 10 / 4 = 0,01 y Z0,01 = -2,33:
-0,949 > -2,33, mantenemos H0. No hay evidencia suficiente para concluir que ha habido transferencia. Slo si T hubiera tomado valor 0, podramos haber llegado a tal conclusin ya que P (T " 0) " 0,001 < 0,01.
9
CONCLUSION
Las pruebas estadsticas con las que se encuentran ms familiarizados los investigadores y a las que se dedica la mayor parte de los libros de texto, es la estadstica paramtrica, las pruebas estadsticas correspondientes a ella, se aplican principalmente a datos de tipo cuantitativo y cada una de ellas tiene algunos supuestos; en la mayor parte de ellas uno de los supuestos se refiere a la normalidad de la poblacin de la cual fue extrada la muestra, si no se cumple este supuesto, sobre todo en las pruebas en las cuales la muestra es de un tamao menor de 30, la conclusin a la que se llegue podra estar equivocada, en estos casos y cuando los datos que se manejan no son cuantitativos, se podra aplicar una prueba estadstica correspondiente a la estadstica no paramtrica, como stas no suelen ser muy conocidas, se ha realizado este artculo con el propsito de dar a conocerlas, ya que, aunque tienen limitaciones, son muy sencillas de aplicar y muy tiles.
10

Estadistica Inferencial

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Inferencial

Cargado por

Copyright:

Formatos disponibles

Instituto Tecnolgico de Colima

Ingeniera en gestin empresarial

Estadistica parametrica y no parametrica

Prof. J. Jess Castrejon Romn

Hctor Manuel Velasco Pea

(3 + 0,5) - (10 / 2) Z = ---------------------------- = -0,949 " 10 / 4 = 0,01 y Z0,01 = -2,33:

También podría gustarte