P. 1
ESTADISTICA INFERENCIAL

ESTADISTICA INFERENCIAL

|Views: 159|Likes:
Publicado porIsabel Murguia

More info:

Published by: Isabel Murguia on Mar 15, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

11/25/2012

pdf

text

original

Instituto Tecnológico de Colima

Ingeniería en gestión empresarial

Estadistica inferencial 1

Estadistica parametrica y no parametrica

Prof. J. Jesús Castrejon Román

Héctor Manuel Velasco Peña

Aula t 7
1

Feb. /2012

Los contrastes no paramétricos son generalmente. en el presente tema trataré procedimientos no paramétricos para contrastar la igualdad de los parámetros de centralización de dos distribuciones poblacionales. Mi objetivo. muchos de estos contrastes siguen siendo aproximadamente válidos cuando se aplican a muestras muy grandes. Así. Es decir. En este tema intentaré describir contrastes no paramétricos que son apropiados para analizar algunos de los problemas que hubiera podido encontrar antes. en aplicaciones prácticas. Este tema presentará un grupo de técnicas llamadas no páramétricas que son útiles cuando estas suposiciones no se cumplen. dicho supuesto de normalidad no sea sostenible. Tales contrastes se denominan no paramétricos. es dar una idea general de aquellos métodos que son mas utilizados. Las suposiciones comunes son que la población sigue una distribución normal. válidos cualquiera que sea la distribución de la población. 2 . incluso si la distribución de la población no es normal. Lo deseable entonces será buscar la inferncia en contrastes que sean válidos bajo un amplio rango de distribuciones de la población. muchas veces se da también el caso de que.INTRODUCCIÓN Partiendo de la base de que algunos contrastes de hipótesis dependen del supuesto de normalidad. sin importar la distribución de los miembros de la población. que varias poblaciones tienen varianzas iguales y que los datos se miden en una escala de intervalos o en una escala de razón. La mayor parte de las técnicas estudiadas hacen suposiciones sobre la composición de los datos de la población. Sin embargo. dichos contrastes pueden ser desarrollados de manera que tengan el nivel de significación requerido.

de 20 a 40 años. La mayoría de procedimientos paramétricos requiere conocer la forma de distribución para las mediciones resultantes de la población estudiada. Estas son determinadas usando un número finito de parámetros. Contraste de hipótesis. Es la que requiere que los elementos que integran las muestras contengan elementos parámetros o medibles. pero desconocemos cuál es la media y la desviación de dicha normal. esto quiere decir que nuestros datos deben tener un orden y una numeración del intervalo. de 40 a 60. La media y la desviación típica de la desviación normal son los dos parámetros que queremos estimar. etc.DESARROLLO La estadística paramétrica es una rama de la estadística inferencial que comprende los procedimientos estadísticos y de decisión que están basados en las distribuciones de los datos reales. Esto es. 3 . datos categorizados en: niños. Estimación por intervalos (buscamos un intervalo de confianza). ya que hay números con los cuales realizar cálculos estadísticos. Puede resolver tres tipos de problemas:    Estimación puntual: En la que pretendemos darle un valor al parámetro a estimar. adultos y ancianos no pueden ser interpretados mediante la estadística paramétrica ya que no se puede hallar un parámetro numérico (como por ejemplo la media de edad) cuando los datos no son numéricos. si conocemos que la altura de las personas sigue una distribución normal. jóvenes. Es decir nuestros datos pueden estar categorizados en: menores de 20 años. donde buscamos contrastar información acerca del parámetro. Sin embargo. Cuando desconocemos totalmente que distribución siguen nuestros datos entonces deberemos aplicar primero un test no paramétrico. de 60 a 80. por ejemplo. Para la inferencia paramétrica es requerida como mínimo una escala de intervalo. que nos ayude a conocer primero la distribución.

la tarea de decidir por cuál de todos ellos guiarse o qué hacer en caso de que dos test nos den resultados opuestos. pues son los datos observados los que la determinan.ESTADISTICA NO PARAMETRICA La estadística no paramétrica es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos. Esto es. no se puede aplicar todos los test y quedarse con el que mejor convenga para la investigación sin verificar si se cumplen las 4 . como mínimo. cuando el nivel de medida empleado no sea. simplemente. de intervalo. quedando para el investigador. Hay que decir que. Su distribución no puede ser definida a priori. Las principales pruebas no paramétricas son las siguientes:                    Prueba χ² de Pearson Prueba binomial Prueba de Anderson-Darling Prueba de Cochran Prueba de Cohen kappa Prueba de Fisher Prueba de Friedman Prueba de Kendall Prueba de Kolmogórov-Smirnov Prueba de Kruskal-Wallis Prueba de Kuiper Prueba de Mann-Whitney o prueba de Wilcoxon Prueba de McNemar Prueba de la mediana Prueba de Siegel-Tukey Coeficiente de correlación de Spearman Tablas de contingencia Prueba de Wald-Wolfowitz Prueba de los signos de Wilcoxon La mayoría de estos test estadísticos están programados en los paquetes estadísticos más frecuentes. para poder aplicar cada uno existen diversas hipótesis nulas que deben cumplir nuestros datos para que los resultados de aplicar el test sean fiables. La utilización de estos métodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribución conocida.

Los procedimientos no paramétricos o de distribución libre se usan con mayor frecuencia por los analistas de datos. la mayor parte de estas pruebas aún son confiables cuando experimentamos ligeras desviaciones de la normalidad. Tradicionalmente. Esto ocurre sobre todo cuando el investigador desconoce la naturaleza interna de los test y se limita a aplicarlos sistemáticamente. 5 . dos jueces deben clasificar cinco marcas de cerveza de mucha demanda mediante la asignación de un grado de 1 a la marca que se considera que tiene la mejor calidad global. La violación de las hipótesis necesarias para un test invalidan cualquier resultado posterior y son una de las causas más frecuentes de que un estudio sea estadísticamente incorrecto. Se puede utilizar entonces una prueba no paramétrica para determinar donde existe algún acuerdo entre los dos jueces. Un ejemplo donde se aplica una prueba no paramétrica es el siguiente. Afortunadamente. una prueba no paramétrica requerirá la correspondiente prueba no paramétrica. no utilizan la información que proporciona la muestra. Existen muchas aplicaciones en la ciencia y la ingeniería donde los datos se reportan no como valores de un continuo sino mas bien en una escala ordinal tal que es bastante natural asignar rangos a los datos. llamados no paramétricos ó métodos de distribución libre. En primer lugar. cuando se pueden aplicar ambos métodos. para lograr la misma potencia. estos procedimientos de prueba se denominan métodos paramétricos. La mayor parte de los procedimientos de prueba de hipótesis que se presentan en las unidades anteriores se basan en la suposición de que las muestras aleatorias se seleccionan de poblaciones normales. que a menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las poblaciones fundamentales. En consecuencia. en particular cuando el tamaño de la muestra es grande. excepto que éstas son continuas. etcétera. un grado 2 a la segunda mejor. y por ello una prueba no paramétrica será menos eficiente que el procedimiento paramétrico correspondiente.hipótesis necesarias. Se debe señalar que hay varias desventajas asociadas con las pruebas no perimétricas. En esta sección se consideran varios procedimientos de prueba alternativos.

si se puede aplicar una prueba paramétrica y una no paramétrica al mismo conjunto de datos.A veces. las pruebas paramétricas son mas poderosas que las pruebas no paramétricas y deben usarse siempre que sea posible. son fáciles de usar y entender. Las pruebas no paramétricas son pruebas estadísticas que no hacen suposiciones sobre la constitución de los datos de la población. debemos aplicar la técnica paramétrica más eficiente... En el caso de la prueba t y la prueba F. 2. y que no siempre se tienen mediciones cuantitativas. ligeras divergencias de la normalidad tienen como resultado desviaciones menores del ideal para las pruebas perimétricas estándar.. se debe reconocer que las suposiciones de normalidad a menudo no se pueden justificar.Llevan a una mayor probabilidad de no rechazar una hipótesis nula falsa (incurriendo en un error de tipo II). Por lo general. 2.. Es importante observar.. que aunque las pruebas no paramétricas no hacen suposiciones sobre la distribución de la 6 . En resumen.Se pueden usar con datos cualitativos. Esto es cierto en particular para la prueba t y la prueba F.Como se indicó antes. 4.Eliminan la necesidad de suposiciones restrictivas de las pruebas paramétricas.Se pueden usar con muestras pequeñas. Las pruebas no paramétricas tienen varias ventajas sobre las pruebas paramétricas: 1. 3.No son tan eficientes como las paramétricas.. También las pruebas no paramétricas tienen desventajas: 1. el valor P citado puede ser ligeramente erróneo si existe una violación moderada de la suposición de normalidad. ignoran. Sin embargo. desperdician o pierden información.. 3.Por lo general.

0. y a 4 de ellos les daba igual.> -Z "(0. 56 de los niños prefirieron el sabor a vainilla.5 frente a H1: p"0. Se quiere contrastar frente a una alternativa bilateral la hipótesis nula de que no existe en la población una preferencia por un sabor u otro.5 Rechazar H0 si -------------------.5 /2 /2 . muchas veces se apoyan en distribuciones muestrales como la normal o la ji cuadrada. lo que queremos contrastar es H0: p=0. Si p es la proporción de niños en la población que prefieren el sabor a vainilla.0.583 .5 0.583 Para un nivel de significación decisión es: Px . Como cuatro de los niños no han preferido un sabor a otro. la regla de 7 . EJEMPLO 1 A una muestra aleatoria de cien niños se les pidió que comparasen dos nuevos sabores de helados: vainilla y fresa.5 -------------------.0. La proporción de niños que han preferido el sabor a vainilla es: Px = 56 / 96 = 0.5) / n ó Px .población que se muestrea.5)(0.0.5.5) / n En nuestro caso Px .5)(0.< -Z "(0. tenemos un tamaño muestral de 96 niños. 40 prefirieron el sabor a fresa.

63 "(0. Si la hipótesis nula de que el mismo número de niños prefieren el sabor a vainilla que el sabor a fresa fuese cierta. Por tanto. será ligeramente superior a uno sobre diez.1032.5) / n "(0. la hipótesis nula podrá ser rechazada para todos los niveles de significación superiores al 10.63. /2 = 0. 8 .16% inferior y superior del área total bajo la función de densidad. La figura muestra las probabilidades de las colas de una distribución normal correspondientes al 5. la probabilidad de observar unos resultados maestrales tan extremos. En nuestro caso. los datos muestran una modesta evidencia en contra de dicha hipótesis.= -----------------------.5) / 96 Vemos.5)(0.5)(0.32%.0516. o mas extremos que los actualmente obtenidos.= 1.-------------------. de manera que = 0. que si Z /2 = 1.

01 y Z0.01 = -2. mantenemos H0.= -0. se diseña un experimento en el que cada sujeto se le presentan 5 tareas simples y a continuación 1 tarea compleja. No hay evidencia suficiente para concluir que ha habido transferencia. Si algún sujeto contestaba “ igualmente difícil”.33: -0. 9 .001 < 0.33.01.EJEMPLO 2 Como parte de un estudio sobre transferencia del aprendizaje entre tareas simples y complejas. se le seguía preguntando hasta decidirse por “ mas fácil “ o “ mas difícil “.949 > -2. Las respuestas dadas por los 10 sujetos fueron: SUJETO 1 2 3 4 5 6 7 8 9 10 RESPUESTA D F F D F F F D F F ¿ Podemos concluir que ha habido transferencia. Al finalizar ésta se le pregunta a cada sujeto si le ha parecido mas fácil o mas difícil que las 5 anteriores.(10 / 2) Z = ---------------------------.949 " 10 / 4 = 0.) y F = + -) "½ (No ha habido transferencia) H1: P (-) <½ (Ha habido transferencia) bajo H0 p (-) es constante por cada sujeto. (3 + 0. a un nivel de significación de 0. Sólo si T hubiera tomado valor 0.5) . podríamos haber llegado a tal conclusión ya que P (T " 0) " 0.01 ? Siendo D (Mas difícil = .

sobre todo en las pruebas en las cuales la muestra es de un tamaño menor de 30. las pruebas estadísticas correspondientes a ella. ya que. si no se cumple este supuesto. como éstas no suelen ser muy conocidas. la conclusión a la que se llegue podría estar equivocada. en estos casos y cuando los datos que se manejan no son cuantitativos. es la estadística paramétrica. son muy sencillas de aplicar y muy útiles. se podría aplicar una prueba estadística correspondiente a la estadística no paramétrica. se aplican principalmente a datos de tipo cuantitativo y cada una de ellas tiene algunos supuestos. se ha realizado este artículo con el propósito de dar a conocerlas. aunque tienen limitaciones. en la mayor parte de ellas uno de los supuestos se refiere a la normalidad de la población de la cual fue extraída la muestra. 10 .CONCLUSION Las pruebas estadísticas con las que se encuentran más familiarizados los investigadores y a las que se dedica la mayor parte de los libros de texto.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->