Instituto Tecnológico de Colima

Ingeniería en gestión empresarial

Estadistica inferencial 1

Estadistica parametrica y no parametrica

Prof. J. Jesús Castrejon Román

Héctor Manuel Velasco Peña

Aula t 7
1

Feb. /2012

muchas veces se da también el caso de que. que varias poblaciones tienen varianzas iguales y que los datos se miden en una escala de intervalos o en una escala de razón. Este tema presentará un grupo de técnicas llamadas no páramétricas que son útiles cuando estas suposiciones no se cumplen.INTRODUCCIÓN Partiendo de la base de que algunos contrastes de hipótesis dependen del supuesto de normalidad. dicho supuesto de normalidad no sea sostenible. dichos contrastes pueden ser desarrollados de manera que tengan el nivel de significación requerido. La mayor parte de las técnicas estudiadas hacen suposiciones sobre la composición de los datos de la población. Tales contrastes se denominan no paramétricos. Así. en el presente tema trataré procedimientos no paramétricos para contrastar la igualdad de los parámetros de centralización de dos distribuciones poblacionales. Lo deseable entonces será buscar la inferncia en contrastes que sean válidos bajo un amplio rango de distribuciones de la población. sin importar la distribución de los miembros de la población. Los contrastes no paramétricos son generalmente. Es decir. válidos cualquiera que sea la distribución de la población. 2 . Las suposiciones comunes son que la población sigue una distribución normal. incluso si la distribución de la población no es normal. muchos de estos contrastes siguen siendo aproximadamente válidos cuando se aplican a muestras muy grandes. Mi objetivo. en aplicaciones prácticas. es dar una idea general de aquellos métodos que son mas utilizados. Sin embargo. En este tema intentaré describir contrastes no paramétricos que son apropiados para analizar algunos de los problemas que hubiera podido encontrar antes.

pero desconocemos cuál es la media y la desviación de dicha normal. La media y la desviación típica de la desviación normal son los dos parámetros que queremos estimar. adultos y ancianos no pueden ser interpretados mediante la estadística paramétrica ya que no se puede hallar un parámetro numérico (como por ejemplo la media de edad) cuando los datos no son numéricos. Puede resolver tres tipos de problemas:    Estimación puntual: En la que pretendemos darle un valor al parámetro a estimar. Estas son determinadas usando un número finito de parámetros.DESARROLLO La estadística paramétrica es una rama de la estadística inferencial que comprende los procedimientos estadísticos y de decisión que están basados en las distribuciones de los datos reales. Cuando desconocemos totalmente que distribución siguen nuestros datos entonces deberemos aplicar primero un test no paramétrico. La mayoría de procedimientos paramétricos requiere conocer la forma de distribución para las mediciones resultantes de la población estudiada. esto quiere decir que nuestros datos deben tener un orden y una numeración del intervalo. datos categorizados en: niños. donde buscamos contrastar información acerca del parámetro. que nos ayude a conocer primero la distribución. ya que hay números con los cuales realizar cálculos estadísticos. Es decir nuestros datos pueden estar categorizados en: menores de 20 años. Es la que requiere que los elementos que integran las muestras contengan elementos parámetros o medibles. Esto es. Sin embargo. si conocemos que la altura de las personas sigue una distribución normal. etc. Para la inferencia paramétrica es requerida como mínimo una escala de intervalo. de 40 a 60. de 60 a 80. por ejemplo. Estimación por intervalos (buscamos un intervalo de confianza). Contraste de hipótesis. de 20 a 40 años. jóvenes. 3 .

para poder aplicar cada uno existen diversas hipótesis nulas que deben cumplir nuestros datos para que los resultados de aplicar el test sean fiables. pues son los datos observados los que la determinan. La utilización de estos métodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribución conocida.ESTADISTICA NO PARAMETRICA La estadística no paramétrica es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos. como mínimo. quedando para el investigador. la tarea de decidir por cuál de todos ellos guiarse o qué hacer en caso de que dos test nos den resultados opuestos. Esto es. Su distribución no puede ser definida a priori. Las principales pruebas no paramétricas son las siguientes:                    Prueba χ² de Pearson Prueba binomial Prueba de Anderson-Darling Prueba de Cochran Prueba de Cohen kappa Prueba de Fisher Prueba de Friedman Prueba de Kendall Prueba de Kolmogórov-Smirnov Prueba de Kruskal-Wallis Prueba de Kuiper Prueba de Mann-Whitney o prueba de Wilcoxon Prueba de McNemar Prueba de la mediana Prueba de Siegel-Tukey Coeficiente de correlación de Spearman Tablas de contingencia Prueba de Wald-Wolfowitz Prueba de los signos de Wilcoxon La mayoría de estos test estadísticos están programados en los paquetes estadísticos más frecuentes. simplemente. Hay que decir que. no se puede aplicar todos los test y quedarse con el que mejor convenga para la investigación sin verificar si se cumplen las 4 . cuando el nivel de medida empleado no sea. de intervalo.

La violación de las hipótesis necesarias para un test invalidan cualquier resultado posterior y son una de las causas más frecuentes de que un estudio sea estadísticamente incorrecto. Los procedimientos no paramétricos o de distribución libre se usan con mayor frecuencia por los analistas de datos. dos jueces deben clasificar cinco marcas de cerveza de mucha demanda mediante la asignación de un grado de 1 a la marca que se considera que tiene la mejor calidad global. Afortunadamente. En primer lugar. excepto que éstas son continuas. Se debe señalar que hay varias desventajas asociadas con las pruebas no perimétricas. 5 . que a menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las poblaciones fundamentales. Existen muchas aplicaciones en la ciencia y la ingeniería donde los datos se reportan no como valores de un continuo sino mas bien en una escala ordinal tal que es bastante natural asignar rangos a los datos. un grado 2 a la segunda mejor. En esta sección se consideran varios procedimientos de prueba alternativos. etcétera. para lograr la misma potencia. Un ejemplo donde se aplica una prueba no paramétrica es el siguiente. en particular cuando el tamaño de la muestra es grande. Esto ocurre sobre todo cuando el investigador desconoce la naturaleza interna de los test y se limita a aplicarlos sistemáticamente. no utilizan la información que proporciona la muestra. La mayor parte de los procedimientos de prueba de hipótesis que se presentan en las unidades anteriores se basan en la suposición de que las muestras aleatorias se seleccionan de poblaciones normales. En consecuencia. la mayor parte de estas pruebas aún son confiables cuando experimentamos ligeras desviaciones de la normalidad. Se puede utilizar entonces una prueba no paramétrica para determinar donde existe algún acuerdo entre los dos jueces.hipótesis necesarias. estos procedimientos de prueba se denominan métodos paramétricos. una prueba no paramétrica requerirá la correspondiente prueba no paramétrica. Tradicionalmente. llamados no paramétricos ó métodos de distribución libre. y por ello una prueba no paramétrica será menos eficiente que el procedimiento paramétrico correspondiente. cuando se pueden aplicar ambos métodos.

el valor P citado puede ser ligeramente erróneo si existe una violación moderada de la suposición de normalidad.Se pueden usar con muestras pequeñas. 3. se debe reconocer que las suposiciones de normalidad a menudo no se pueden justificar.Se pueden usar con datos cualitativos. si se puede aplicar una prueba paramétrica y una no paramétrica al mismo conjunto de datos.No son tan eficientes como las paramétricas. 4. que aunque las pruebas no paramétricas no hacen suposiciones sobre la distribución de la 6 .Por lo general. debemos aplicar la técnica paramétrica más eficiente. En el caso de la prueba t y la prueba F. 3. desperdician o pierden información. ignoran. ligeras divergencias de la normalidad tienen como resultado desviaciones menores del ideal para las pruebas perimétricas estándar. y que no siempre se tienen mediciones cuantitativas. Por lo general. Las pruebas no paramétricas son pruebas estadísticas que no hacen suposiciones sobre la constitución de los datos de la población. En resumen.A veces. Sin embargo. 2.Llevan a una mayor probabilidad de no rechazar una hipótesis nula falsa (incurriendo en un error de tipo II)..Como se indicó antes. 2.Eliminan la necesidad de suposiciones restrictivas de las pruebas paramétricas. son fáciles de usar y entender. También las pruebas no paramétricas tienen desventajas: 1. las pruebas paramétricas son mas poderosas que las pruebas no paramétricas y deben usarse siempre que sea posible.... Es importante observar... Las pruebas no paramétricas tienen varias ventajas sobre las pruebas paramétricas: 1. Esto es cierto en particular para la prueba t y la prueba F..

muchas veces se apoyan en distribuciones muestrales como la normal o la ji cuadrada.5 -------------------.5 0.5.583 . tenemos un tamaño muestral de 96 niños. Como cuatro de los niños no han preferido un sabor a otro.5) / n En nuestro caso Px .> -Z "(0. 56 de los niños prefirieron el sabor a vainilla.población que se muestrea.< -Z "(0.583 Para un nivel de significación decisión es: Px .0. y a 4 de ellos les daba igual.5 Rechazar H0 si -------------------.5) / n ó Px .5 /2 /2 . EJEMPLO 1 A una muestra aleatoria de cien niños se les pidió que comparasen dos nuevos sabores de helados: vainilla y fresa. lo que queremos contrastar es H0: p=0.0.5)(0. La proporción de niños que han preferido el sabor a vainilla es: Px = 56 / 96 = 0. Se quiere contrastar frente a una alternativa bilateral la hipótesis nula de que no existe en la población una preferencia por un sabor u otro. 40 prefirieron el sabor a fresa.0.5)(0. Si p es la proporción de niños en la población que prefieren el sabor a vainilla. la regla de 7 .5 frente a H1: p"0.0.

5) / n "(0. En nuestro caso.63 "(0. Por tanto.-------------------.5)(0. la probabilidad de observar unos resultados maestrales tan extremos.63.= -----------------------. que si Z /2 = 1.16% inferior y superior del área total bajo la función de densidad.32%.5) / 96 Vemos. la hipótesis nula podrá ser rechazada para todos los niveles de significación superiores al 10.1032. será ligeramente superior a uno sobre diez. Si la hipótesis nula de que el mismo número de niños prefieren el sabor a vainilla que el sabor a fresa fuese cierta. o mas extremos que los actualmente obtenidos.= 1. de manera que = 0. La figura muestra las probabilidades de las colas de una distribución normal correspondientes al 5. los datos muestran una modesta evidencia en contra de dicha hipótesis.0516. /2 = 0. 8 .5)(0.

se diseña un experimento en el que cada sujeto se le presentan 5 tareas simples y a continuación 1 tarea compleja.01 = -2.01. mantenemos H0.5) . Las respuestas dadas por los 10 sujetos fueron: SUJETO 1 2 3 4 5 6 7 8 9 10 RESPUESTA D F F D F F F D F F ¿ Podemos concluir que ha habido transferencia.33: -0. 9 . Al finalizar ésta se le pregunta a cada sujeto si le ha parecido mas fácil o mas difícil que las 5 anteriores. a un nivel de significación de 0. podríamos haber llegado a tal conclusión ya que P (T " 0) " 0.= -0.01 ? Siendo D (Mas difícil = . No hay evidencia suficiente para concluir que ha habido transferencia. se le seguía preguntando hasta decidirse por “ mas fácil “ o “ mas difícil “.001 < 0.) y F = + -) "½ (No ha habido transferencia) H1: P (-) <½ (Ha habido transferencia) bajo H0 p (-) es constante por cada sujeto. (3 + 0.01 y Z0.EJEMPLO 2 Como parte de un estudio sobre transferencia del aprendizaje entre tareas simples y complejas.(10 / 2) Z = ---------------------------.949 " 10 / 4 = 0.949 > -2.33. Sólo si T hubiera tomado valor 0. Si algún sujeto contestaba “ igualmente difícil”.

se ha realizado este artículo con el propósito de dar a conocerlas. ya que. son muy sencillas de aplicar y muy útiles. en estos casos y cuando los datos que se manejan no son cuantitativos. las pruebas estadísticas correspondientes a ella. se aplican principalmente a datos de tipo cuantitativo y cada una de ellas tiene algunos supuestos. 10 .CONCLUSION Las pruebas estadísticas con las que se encuentran más familiarizados los investigadores y a las que se dedica la mayor parte de los libros de texto. se podría aplicar una prueba estadística correspondiente a la estadística no paramétrica. aunque tienen limitaciones. es la estadística paramétrica. sobre todo en las pruebas en las cuales la muestra es de un tamaño menor de 30. como éstas no suelen ser muy conocidas. la conclusión a la que se llegue podría estar equivocada. si no se cumple este supuesto. en la mayor parte de ellas uno de los supuestos se refiere a la normalidad de la población de la cual fue extraída la muestra.

Sign up to vote on this title
UsefulNot useful