Está en la página 1de 35

PRUEBA DE HIPOTESIS.

Muchos problemas de ingeniera, ciencia, y administracin, requieren que se tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniera, pueden formularse como problemas de prueba de hiptesis. Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una o ms poblaciones. Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters se centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae en decir si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de manera formal como nter%Ho; = 50 cm/s nter%H1; 50 cm/s La proposicin Ho; = 50 cm/s, se conoce como hiptesis nula, mientras que la proposicin H1; 50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la hiptesis alternativa especifica valores de que pueden ser mayores o menores que 50 cm/s, tambin se conoce como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una hiptesis alternativa unilateral, como en nter%Ho; = 50 cm/s Ho; = 50 cm/s nter% nter%H1; < 50 cm/s H1; > 50 cm/s.

Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres maneras diferentes: 1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor del parmetro. 2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o modelo. 3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las especificaciones. Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin equivocada. La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms caractersticas de poblaciones que al inicio se supone cierta (es decir, la creencia a priori). La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a Ho, y sta es la hiptesis del investigador.

La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se contina creyendo en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis por prueba de hiptesis son rechazar Ho o no rechazar Ho.

DISCREPANCIA.
Cuando dos mediciones de la misma cantidad se hallan en desacuerdo, decimos que existe una discrepancia. Numricamente, definimos la discrepancia entre dos mediciones como su diferencia: Discrepancia = diferencia entre dos valores medidos de la misma cantidad Ms especficamente, cada una de las dos mediciones consiste de un valor que es nuestra mejor estimacin del verdadero valor, y una incerteza. Cada una de estas mediciones puede ser el resultado de largas series de medidas, las cuales fueron procesadas en la forma vista en la seccin anterior. O pueden ser el resultado de dos mediciones individuales, con la incerteza calculada mediante las simples reglas de propagacin del error vistas anteriormente. En cualquier caso, definimos la discrepancia como la diferencia entre las dos mejores estimaciones. Por ejemplo, si dos estudiantes miden la misma resistencia y obtienen los siguientes valores Estudiante A: 15 1 ohms; Estudiante B: 25 2 ohms, su discrepancia es discrepancia = 25 15 = 10 ohms. Note que una discrepancia puede o no ser significativa. Entre las dos mediciones que acabamos de comentar existe una discrepancia significativa, puesto que no encontramos ningn valor posible de resistencia que sea compatible con ambas mediciones. Obviamente, al menos una de las mediciones es incorrecta, y se necesita en este caso buscar cuidadosamente qu es lo que ha fallado. Suponga ahora que otros dos estudiantes has reportado los siguientes resultados: Estudiante C: 16 8 ohms; Estudiante D: 26 9 ohms.

Aqu, nuevamente, la discrepancia es de 10 ohms. Sin embargo, la discrepancia aqu no es significativa, dado que los mrgenes de error de ambos estudiantes se solapan confortablemente y ambas mediciones podran ser igualmente correctas. La discrepancia entre dos mediciones de la misma cantidad debe ser evaluada entonces no por su tamao, sino por cun grande es comparada con las incertezas en las mediciones.

ERRORES DE TIPO I Y DE TIPO II.


En un estudio de investigacin, el error de tipo I tambin denominado error de tipo alfa ()1 o falso positivo, es el error que se comete cuando el investigador no acepta la hiptesis nula (Ho) siendo sta verdadera en la poblacin. Es equivalente a encontrar un resultado falso positivo, porque el investigador llega a la conclusin de que existe una diferencia entre las hiptesis cuando en realidad no existe. Se relaciona con el nivel de significancia estadstica.

Representacin de los valores posibles de la probabilidad de un error tipo II (rojo) en el ejemplo de un test de significancia estadstica para el parmetro . El error tipo II depende del parmetro . Mientras ms cerca se encuentre este del valor supuesto bajo la hiptesis nula, mayor es la probabilidad de ocurrencia del error tipo II. Debido a que el verdadero valor de es desconocido al hacer la presuncin de la hiptesis alternativa, la probabilidad del error tipo II, en contraste con el error tipo I (azul), no se puede calcular.

La hiptesis de la que se parte H0 aqu es el supuesto de que la situacin experimental presentara un estado normal. Si no se advierte este estado normal, aunque en realidad existe, se trata de un error estadstico tipo I. Algunos ejemplos para el error tipo I seran:

Se considera que el paciente est enfermo, a pesar de que en realidad est sano; hiptesis nula: El paciente est sano. Se declara culpable al acusado, a pesar de que en realidad es inocente; hiptesis nula: El acusado es inocente. No se permite el ingreso de una persona, a pesar de que tiene derecho a ingresar; hiptesis nula: La persona tiene derecho a ingresar.

En un estudio de investigacin, el error de tipo II, tambin llamado error de tipo beta () ( es la probabilidad de que exista ste error) o falso negativo, se comete cuando el investigador no rechaza la hiptesis nula siendo sta falsa en la poblacin. Es equivalente a la probabilidad de un resultado falso negativo, ya que el investigador llega a la conclusin de que ha sido incapaz de encontrar una diferencia que existe en la realidad. Se acepta en un estudio que el valor del error beta est entre el 5 y el 20%. Contrariamente al error tipo I, en la mayora de los casos no es posible calcular la probabilidad del error tipo II. La razn de esto se encuentra en la manera en que se formulan las hiptesis en una prueba estadstica. Mientras que la hiptesis nula representa siempre una afirmacin enrgica (como por ejemplo H0: Promedio = 0) la hiptesis alternativa, debido a que engloba todas las otras posibilidades, es generalmente de naturaleza global (por ejemplo H1: Promedio 0 ). El grfico de la derecha ilustra la probabilidad del error tipo II (rojo) en dependencia del promedio desconocido. El poder o potencia del estudio representa la probabilidad de observar en la muestra una determinada diferencia o efecto, si existe en la poblacin. Es el complementario del error de tipo II (1-).

Errores en el contraste
Artculo principal: Contraste de hiptesis Una vez realizado el contraste de hiptesis, se habr optado por una de las dos hiptesis, la hiptesis nula o base o la hiptesis alternativa , y la decisin escogida coincidir o no con la que en realidad es cierta. Se pueden dar los cuatro casos que se exponen en el siguiente cuadro: es cierta Se escogi Se escogi No hay positivo) error es cierta (verdadero Error de tipo II ( o falso negativo) error (verdadero

Error de tipo I ( o falso No hay positivo) negativo)

Si la probabilidad de cometer un error de tipo I est unvocamente determinada, su valor se suele denotar por la letra griega , y en las mismas condiciones, se denota por la probabilidad de cometer el error de tipo II, esto es:

En este caso, se denomina Potencia del contraste al valor 1-, esto es, a la probabilidad de escoger cuando esta es cierta . Cuando es necesario disear un contraste de hiptesis, sera deseable hacerlo de tal manera que las probabilidades de ambos tipos de error fueran tan pequeas como fuera posible. Sin embargo, con una muestra de tamao prefijado, disminuir la probabilidad del error de tipo I, , conduce a incrementar la probabilidad del error de tipo II, . Usualmente, se disean los contrastes de tal manera que la probabilidad sea el 5% (0,05), aunque a veces se usan el 10% (0,1) o 1% (0,01) para adoptar condiciones ms relajadas o ms estrictas. El recurso para aumentar la potencia del contraste, esto es, disminuir , probabilidad de error de tipo II, es aumentar el tamao muestral, lo que en la prctica conlleva un incremento de los costes del estudio que se quiere realizar.

Contraste de hiptesis.
Dentro de la inferencia estadstica, un contraste de hiptesis (tambin denominado test de hiptesis o prueba de significacin) es un procedimiento para juzgar si una propiedad que se supone cumple una poblacin estadstica es compatible con lo observado en una muestra de dicha poblacin. Fue iniciada por Ronald Fisher y fundamentada posteriormente porJerzy Neyman y Karl Pearson. Mediante esta teora, se aborda el problema estadstico considerando una hiptesis determinada y una hiptesis alternativa , y se intenta dirimir cul de las dos es la hiptesis verdadera, tras aplicar el problema estadstico a un cierto nmero de experimentos. Est fuertemente asociada a los considerados errores de tipo I y II en estadstica, que definen respectivamente, la posibilidad de tomar un suceso verdadero como falso, o uno falso como verdadero. Existen diversos mtodos para desarrollar dicho test, minimizando los errores de tipo I y II, y hallando por tanto con una determinada potencia, la hiptesis con mayor probabilidad de ser correcta. Los tipos ms importantes son los test centrados, de hiptesis y alternativa simple, aleatorizados, etc. Dentro de los tests no paramtricos, el ms extendido es probablemente el test de la U de MannWhitney.

Introduccin.
Si sospechamos que una moneda ha sido trucada para que se produzcan ms caras que cruces al lanzarla al aire, podramos realizar 30 lanzamientos, tomando nota del nmero de caras obtenidas. Si obtenemos un valor demasiado alto, por ejemplo 25 o ms, consideraramos que el resultado es poco compatible con la hiptesis de que la moneda no est trucada, y concluiramos que las observaciones contradicen dicha hiptesis.

La aplicacin de clculos probabilsticos permite determinar a partir de qu valor debemos rechazar la hiptesis garantizando que la probabilidad de cometer un error es un valor conocido a priori. Las hiptesis pueden clasificarse en dos grupos, segn: 1. Especifiquen un valor concreto o un intervalo para los parmetros del modelo. 2. Determinen el tipo de distribucin de probabilidad que ha generado los datos. Un ejemplo del primer grupo es la hiptesis de que la media de una variable es 10, y del segundo que la distribucin de probabilidad es la distribucin normal. Aunque la metodologa para realizar el contraste de hiptesis es anloga en ambos casos, distinguir ambos tipos de hiptesis es importante puesto que muchos problemas de contraste de hiptesis respecto a un parmetro son, en realidad, problemas de estimacin, que tienen una respuesta complementaria dando un intervalo de confianza (o conjunto de intervalos de confianza) para dicho parmetro. Sin embargo, las hiptesis respecto a la forma de la distribucin se suelen utilizar para validar un modelo estadstico para un fenmeno aleatorio que se est estudiando.

Planteamiento clsico del contraste de hiptesis.


Se denomina hiptesis nula a la hiptesis que se desea contrastar. El nombre de "nula" significa sin valor, efecto o consecuencia, lo cual sugiere que debe identificarse con la hiptesis de no cambio (a partir de la opinin actual); no diferencia, no mejora, etc. representa la hiptesis que mantendremos a no ser que los datos indiquen su falsedad, y puede entenderse, por tanto, en el sentido de neutra. La hiptesis nunca se considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la hiptesis de que dos poblaciones tienen la misma media puede ser rechazada fcilmente cuando ambas difieren mucho, analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser "demostrada" mediante muestreo, puesto que siempre cabe la

posibilidad de que las medias difieran en una cantidad lo suficientemente pequea para que no pueda ser detectada, aunque la muestra sea muy grande. A partir de una muestra de la poblacin en estudio, se extrae un estadstico (esto es, una valor que es funcin de la muestra) cuya distribucin de probabilidad est relacionada con la hiptesis en estudio y sea conocida. Se toma entonces el conjunto de valores que es ms improbable bajo la hiptesis como regin de rechazo, esto es, el conjunto de valores para el que consideraremos que, si el valor del estadstico obtenido entra dentro de l, rechazaremos la hiptesis. La probabilidad de que se obtenga un valor del estadstico que entre en la regin de rechazo an siendo cierta la hiptesis puede calcularse. De esta manera, se puede escoger dicha regin de tal forma que la probabilidad de cometer este error sea suficientemente pequea. Siguiendo con el anterior ejemplo de la moneda trucada, la muestra de la poblacin es el conjunto de los treinta lanzamientos a realizar, el estadstico escogido es el nmero total de caras obtenidas, y la regin de rechazo est constituida por los nmeros totales de caras iguales o superiores a 25. La probabilidad de cometer el error de admitir que la moneda est trucada a pesar de que no lo est es igual a la probabilidad binomial de tener 25 "xitos" o ms en una serie de 30 ensayos de Bernoulli con probabilidad de "xito" 0,5 en cada uno, entonces: 0,0002, pues existe la posibilidad, aunque poco probable, que la muestra nos d ms de 25 caras sin haber sido la moneda trucada.

Procedimientos de prueba.
Un procedimiento de prueba es una regla con base en datos muestrales, para determinar si se rechaza . Ejemplo: Una prueba de : p = .10 contra : p < .10, podra estar basada en el examen de una muestra aleatoria de n = 200 objetos. Representamos con X el numero de objetos defectuosos de la muestra, una variable aleatoria binomial; x representa el valor observado de X. si es verdadera, E(X) = np = 200(.10) = 20, mientras, podemos esperar menos de 20 objetos defectuosos si es verdadera. Un valor de x ligeramente debajo de 20 no contradice de manera contundente a asi que es razonable rechazar solo si x es considerablemente menor que 20. Un

procedimiento de prueba es rechazar si x15 y no rechazar de otra forma. En este caso, la regin de rechazo esta formada por x = 0, 1, 2, , y 15. no sera rechazada si x= 16, 17,, 199 o 200. Un procedimiento de prueba se especifica por lo siguiente: 1. Un estadstico de prueba: una funcin de los datos muestrales en los cuales se basa la decisin de rechazar o no rechazar . 2. Una regin de rechazo, el conjunto de todos los valores del estadstico de prueba para los cuales ser rechazada. Entonces, la hiptesis nula ser rechazada si y solo si el valor observado o calculado del estadstico de prueba se ubica en la regin de rechazo En el mejor de los casos podran desarrollarse procedimientos de prueba para los cuales ningn tipo de error es posible. Pero esto puede alcanzarse solo si una decisin se basa en un examen de toda la poblacin, lo que casi nunca es prctico. La dificultad al usar un procedimiento basado en datos muestrales es que debido a la variabilidad en el muestreo puede resultar una muestra no representativa. Un buen procedimiento es aquel para el cual la probabilidad de cometer cualquier tipo de error es pequea. La eleccin de un valor particular de corte de la regin de rechazo fija las probabilidades de errores tipo I y II. Estas probabilidades de error son representadas por y , respectivamente.

Enfoque actual de los contrastes de hiptesis.


El enfoque actual considera siempre una hiptesis alternativa a la hiptesis nula. De manera explcita o implcita, la hiptesis nula, a la que se denota habitualmente por , se enfrenta a otra hiptesis que denominaremos hiptesis alternativa y que se denota . En los casos en los que no se especifica de manera explcita, podemos considerar que ha quedado definida implcitamente como es falsa. Si por ejemplo deseamos comprobar la hiptesis de que dos distribuciones tienen la misma media, estamos implcitamente considerando como hiptesis alternativa

ambas poblaciones tienen distinta media. Podemos, sin embargo considerar casos en los que no es la simple negacin de . Supongamos por ejemplo que sospechamos que en un juego de azar con un dado, este est trucado para obtener 6. Nuestra hiptesis nula podra ser el dado no est trucado que intentaremos contrastar, a partir de una muestra de lanzamientos realizados, contra la hiptesis alternativa el dado ha sido trucado a favor del 6. Cabra realizar otras hiptesis, pero, a los efectos del estudio que se pretende realizar, no se consideran relevantes. Un test de hiptesis se entiende, en el enfoque moderno, como una funcin de la muestra, corrientemente basada en un estadstico. Supongamos que se tiene una muestra de una poblacin en estudio y que se han formulado hiptesis sobre un parmetro relacionado con la distribucin estadstica de la poblacin. Supongamos que se dispone de un estadstico T(X) cuya distribucin con respecto a , se conoce. Supongamos, tambin, que las hiptesis nula y alternativa tienen la siguiente formulacin:

Un contraste, prueba o test para dichas hiptesis sera una funcin de la muestra de la siguiente forma:

Donde )y

significa que debemos rechazar la hiptesis nula, , que debemos aceptar

(aceptar

(o que no hay evidencia estadstica

contra ). A se la denomina regin de rechazo. En esencia, para construir el test deseado, basta con escoger el estadstico del contraste T(X) y la regin de rechazo .

Se escoge de tal manera que la probabilidad de que T(X) caiga en su interior sea baja cuando se da .

Errores en el contraste.

Artculo principal: Errores de tipo I y de tipo II Una vez realizado el contraste de hiptesis, se habr optado por una de las dos hiptesis, o , y la decisin escogida coincidir o no con la que en realidad es cierta. Se pueden dar los cuatro casos que se exponen en el siguiente cuadro: es cierta Se escogi Se escogi No hay error es cierta Error de tipo II

Error de tipo I No hay error

Si la probabilidad de cometer un error de tipo I est unvocamente determinada, su valor se suele denotar por la letra griega , y en las mismas condiciones, se denota por la probabilidad de cometer el error de tipo II, esto es:

En este caso, se denomina Potencia del contraste al valor 1-, esto es, a la probabilidad de escoger cuando sta es cierta . Cuando es necesario disear un contraste de hiptesis, sera deseable hacerlo de tal manera que las probabilidades de ambos tipos de error fueran tan pequeas como fuera posible. Sin embargo, con una muestra de tamao prefijado, disminuir la probabilidad del error de tipo I, , conduce a incrementar la probabilidad del error de tipo II, . Usualmente, se disean los contrastes de tal manera que la probabilidad sea el 5% (0,05), aunque a veces se usan el 10% (0,1) o 1% (0,01) para adoptar condiciones ms relajadas o ms estrictas. El recurso para aumentar la potencia del contraste, esto es, disminuir , probabilidad de error de tipo II, es aumentar el tamao muestral, lo que en la prctica conlleva un incremento de los costes del estudio que se quiere realizar.

Contraste ms potente.
El concepto de potencia nos permite valorar cual entre dos contrastes con la misma probabilidad de error de tipo I, , es preferible. Si se trata de contrastar dos hiptesis sencillas sobre un parmetro desconocido, , del tipo:

Se trata de escoger entre todos los contrastes posibles con prefijado aquel que tiene mayor potencia, esto es, menor probabilidad de incurrir en el error de tipo II. En este caso el Lema de Neyman-Pearson garantiza la existencia de un contraste de mxima potencia y determina cmo construirlo.

Contraste uniformemente ms potente.


En el caso de que las hiptesis sean compuestas, esto es, que no se limiten a especificar un nico posible valor del parmetro, sino que sean del tipo:

donde y son conjuntos de varios posibles valores, las probabilidades y ya no estn unvocamente determinadas, sino que tomarn diferentes valores segn los distintos valores posibles de . En este caso se dice que un contraste tiene tamao si

esto es, si la mxima probabilidad de cometer un error de tipo I cuando la hiptesis nula es cierta es . En estas circunstancias, se puede considerar como una funcin de , puesto que para cada posible valor de en la hiptesis alternativa se tendra una probabilidad distinta de cometer un error de tipo II. Se define entonces

y, la funcin de potencia del contraste es entonces

esto es, la probabilidad de discriminar que la hiptesis alternativa es cierta para cada valor posible de dentro de los valores posibles de esta misma hiptesis. Se dice que un contraste es uniformemente ms potente de tamao cuando, para todo valor es mayor o igual que el de cualquier otro contraste del mismo tamao. En resumen, se trata de un contraste que garantiza la mxima potencia para todos los valores de en la hiptesis alternativa. Es claro que el caso del contraste uniformemente ms potente para hiptesis compuestas exige el cumplimiento de condiciones ms exigentes que en el caso del contraste ms potente para hiptesis simples. Por ello, no existe un equivalente al Lema de Neyman-Pearson para el caso general. Sin embargo, s existen muchas condiciones en las que, cumplindose determinadas propiedades de las distribuciones de probabilidad implicada y para ciertos tipos de hiptesis, se puede extender el Lema para obtener el contraste uniformemente ms potente del tamao que se desee.

Aplicaciones de los contrastes de hiptesis.


Los contrastes de hiptesis, como la inferencia estadstica en general, son herramientas de amplio uso en la ciencia en general. En particular, la moderna Filosofa de la cienciadesarrolla el concepto de falsabilidad de las teoras cientficas basndose en los conceptos de la inferencia estadstica en general y de los contrastes de hiptesis. En este contexto, cuando se desea optar entre dos posibles teoras cientficas para un mismo fenmeno (dos hiptesis) se debe realizar un contraste estadstico a partir de los datos disponibles sobre el fenmeno que permitan optar por una u otra. Las tcnicas de contraste de hiptesis son tambin de amplia aplicacin en muchos otros casos, como ensayos clnicos de nuevos medicamentos, control de calidad, encuestas, etctera .

FUNDAMENTO BSICOS DEL SPSS.


SPSS es un programa de estadsticas popular usado en una variedad de disciplinas cientficas. Se compone de dos facetas, el paquete estadstico propio y el lenguaje de SPSS, un sistema de sintaxis que se utiliza para ejecutar comandos y procedimientos. Del mismo modo, existen dos enfoques para la utilizacin de SPSS: (a) a travs del sistema de mens y de apuntar y hacer clic aproximacin y (b) a travs del uso de la sintaxis de programacin de SPSS. La mayora de los usuarios encontrarn una combinacin de estos enfoques ms efectivos para llevar a cabo sus anlisis de datos. En la Universidad del Norte de Texas, se han obtenido las licencias del software para Windows y Mac OSX. En esta serie, que se centrar en el programa SPSS para Windows, que es un programa de anlisis de datos completa con muchas capacidades y aplicaciones. Los requisitos para PC y Mac son los siguientes. De SPSS 16.0 para Windows.

De

Sistema Operativo o Microsoft Windows XP (versiones de 32 bits) o Windows Vista (32-bit o 64-bit)

Hardware o Intel o AMD x86 procesador a 1 GHz o superior o RAM: 512 MB de RAM, se recomienda 1 GB o 450 MB de espacio disponible en el disco duro o CD-ROM o Super VGA (800x600) o un monitor de alta resolucin o Para conectar con un servidor SPSS, un adaptador de red que ejecute el protocolo de red TCP / IP

Software o Internet Explorer 6 o superior

Si bien estos requisitos son para la versin 16 de los laboratorios en el campus no cuentan an con 16 (y desde nuestro punto de vista en el RSS que estn en mejor situacin como tal). ----Las variables en SPSS cuentan con una serie de propiedades que deben ser definidas por el investigador o usuario antes de realizar cualquier tipo de anlisis con ella. De la correcta

II. Quin puede utilizar SPSS?

SPSS software se distribuye a travs de licencia de sitio de la universidad. UNT tiene una licencia de sitio que permite a los estudiantes a utilizar el software en cualquier laboratorio de acceso general en el campus. Para los estudiantes que deseen instalar el software en sus propias mquinas, las versiones del software estn disponibles para la venta en la librera de UNT en los precios con descuento acadmico. Para los precios actuales en la mayora de los estudiantes UNT librera usted puede comunicarse con ellos al 940-565-2592, sin embargo el precio es de $ 200 para el 'Grad Pack' y $ 100 por una versin para estudiantes lisiados que vence cada ao. La nica razn para comprarlo es para uso privado, es otra forma ubicua en el campus. SLO profesores a tiempo completo y el personal puede solicitar la instalacin de SPSS en sus mquinas en la escuela o en casa. Est usted de la facultad? Es usted alguien que pone en 40 horas a la semana en el campus de una capacidad completamente no-alumno? Si su respuesta es no tanto a continuacin, usted no califica de ninguna manera, forma o forma de una copia personal de nosotros en RSS. No hay ninguna ambigedad en el uso de la palabra "slo" aqu, a pesar de lo que es mejor amigo de tu primo que es un estudiante en un departamento al otro lado del campus le haya dicho. Y no, no vamos a creer por un segundo que su profesor principal se enva a travs de su copia. III. Cmo SPSS trabajo? SPSS tiene tres archivos bsicos, a saber. los datos, la sintaxis y el archivo de salida. SPSS Data La ventana de datos contiene los archivos del sistema SPSS y muestra los datos en formato de hoja de clculo. Con la versin 14, usted ahora puede tener varios archivos de datos abiertos. Con 16 SPSS tambin est basado en Java, lo que parece haber dado lugar a SPSS perder parte de su "facilidad de uso" la ventaja que tena en relacin con otros algunos paquetes otra estadstica, ya que incluso el uso ocasional puede revelar algunas peculiaridades. Para entrada de datos simple que funciona muy

bien, pero si usted ya est familiarizado con Excel que no necesariamente se encuentra mucha ventaja.

Aqu es donde entrar directamente los datos en SPSS. Las filas son generalmente considerados como unidades de observacin (por ejemplo, los sujetos en estudio), y las columnas se consideran las variables de las unidades de observacin. Usted puede cortar, pegar y borrar registros (unidades de observacin) y columnas (variables) como se desee desde esta ventana, as como los casos y las variables se mueven haciendo clic y arrastrando. SPSS archivos del sistema se almacena de forma predeterminada con la extensin *. sav, pero se pueden guardar como muchos otros tipos de archivos. En particular, se recomienda guardar un conjunto de datos completa como un archivo *. Por (porttil) al menos una vez para salvar a posibles problemas de compatibilidad. La ventana de datos tiene dos puntos de vista, la vista de datos reales por encima y el punto de vista variable, se ve aqu.

Es con el punto de vista variable que se le pueda asignar el tipo de variable, varan los anchos de columna, crear etiquetas de las variables, asignar valores que faltan, etc Le sugerimos que haga todo lo que no es realmente un nombre, por ejemplo, pas o nombre de la persona, como numricos con etiquetas en su lugar, a menos que seas del tipo sdico entonces adelante y aadir lo que probablemente ser un par de horas de trabajo ms tarde. Como nota final, dejar los datos solo. Usuarios de Excel, en particular, vienen al anlisis de datos con los malos hbitos como colorear las clulas y jugar con los tamaos de fuente, etc. Si desea hacer lo mismo con la produccin, tienen en l, pero deja el archivo de datos en s, como lo es a menos que desee un dolor de cabeza ms adelante. Sintaxis SPSS SPSS es un poco raro para m. A la gente le gusta por sus mens, pero los mens son tan limitantes que inevitablemente se tiene que ir a la sintaxis para realizar un anlisis que vale la pena (o, ms probablemente, a otro paquete de estadsticas). Sin embargo, si usted va a utilizar la sintaxis,

SPSS no es flexible ni eficaz en comparacin con otros paquetes. Su lenguaje se desarroll cuando la gente slo este tipo de cosas en los ordenadores centrales y que nunca cambia, a pesar de que la computacin en continua evolucin. Para compensar esto, SPSS cuenta con add-ons que permiten utilizar lenguajes de programacin como Python verdad y R. Pero si puedes usar los como un investigador acadmico aplicado, no habra ninguna razn para estar con el programa SPSS en el primer lugar . En cualquier caso, si prefieren SPSS la mejor manera de utilizarlo es con la sintaxis o muy complementados con ella, la ventana de la que se muestra a continuacin.

Como veremos en el prximo curso, sin duda hace que SPSS para el anlisis de datos mucho ms eficiente con la sintaxis en lugar de utilizar los mens, y hay trucos que uno puede hacer hay que no estn disponibles en los mens (por ejemplo, los poderosos procedimiento MANOVA). Sin embargo, tenga en cuenta que los mens estn todava disponibles en la ventana de sintaxis, as que usted puede utilizar si es necesario. Archivos de sintaxis SPSS *. sps. Adems, con la versin 17.0 del editor de sintaxis ha cambiado un poco, sobre todo para mejor. Sin embargo, existen posibles problemas de compatibilidad correr la sintaxis de 17 en las versiones anteriores. SPSS salida El tercer tipo de archivo comn de SPSS es el archivo de salida (con 16 creo que debe llamar a un visor de archivos).

Data_view

En cierto modo, SPSS tiene una ventaja sobre otros paquetes porque las cosas salen un poco ms fcil en los ojos con la informacin de texto, y los estudiantes que he tenido parece que se enamoran de texto en las redes, por alguna razn. Adems, es muy fcil de exportar a HTML o Powerpoint para su presentacin. Desafortunadamente, esto tiene un precio, es decir, que no se puede hacer nada con los resultados en la salida, por ejemplo, los utilizan como insumo en un nuevo anlisis (al menos no sin una cierta finagaling sintctica notable). Los usuarios del principiante no creo que eso es una gran cosa. Investigadores ms experimentados saben mejor. Dijo que con la versin 16 de salida es ahora muy lenta para llegar, y los grficos de SPSS han quedado muy por detrs de la mayora de los paquetes estadsticos importantes para un rato ahora. En resumen, el texto bastante no es una razn para utilizar un paquete, y mientras que usted puede exportar los grficos, esto ya no es una ventaja que tiene sobre otros paquetes. Una nota final: los usuarios de 16 aos no puede ver el antiguo archivos *. spo sin necesidad de instalar el visor de herencia, que no se instala por defecto, pero est disponible para cualquier usuario de SPSS. La extensin del archivo es ahora *. SPV. IV. Obtencin de datos en SPSS. Hay tres maneras principales de obtener los datos en SPSS: (a) crear un nuevo archivo de datos SPSS, (b) la apertura de los archivos existentes de datos de SPSS, y (c) la importacin de datos de otra fuente, como un archivo ASCII, una hoja de clculo Excel, etc . 1. La creacin de nuevos archivos de datos SPSS. Los datos se pueden introducir directamente en similar a una hoja de clculo Excel SPSS. Sin embargo, si se van a introducir los datos directamente, tendr que nombrar y definir las variables. 2. La apertura de los archivos existentes del sistema SPSS. La apertura de los archivos existentes de SPSS es un procedimiento bastante sencillo, similar a la apertura de otros archivos de Windows. Seleccione "Abrir" en el men Archivo, y se encuentra un cuadro de dilogo que se parece a la figura de abajo. Tambin se puede ver que se puede abrir cualquier tipo de archivo SPSS, no slo archivos de datos, as como llamar fcilmente de los archivos que ha utilizado recientemente (el nmero de archivos recientes se pueden ajustar en Editar / Opciones).

Como se mencion anteriormente, los archivos de SPSS del sistema se almacenan con la extensin *. sav. Por defecto, SPSS se supone que desea entrar en un archivo del sistema SPSS, aunque hay muchos tipos de archivos que pueden acceder a la importacin directa, y esto siempre va a conseguir a alguien que en lugar de estar buscando un archivo de Excel ("Te juro que lo puso en el escritorio !!"). A continuacin, puede ir al directorio donde se almacena el archivo de datos que desea abrir y abrir el archivo.

3. Importar datos desde un archivo ASCII. Por varias razones, los datos son a menudo en formato ASCII o texto, la ms grande es que cualquier programa pueda leer. Con el fin de utilizar los datos en SPSS, los datos deben ser convertidos a un formato de archivo que SPSS puede reconocer, es decir, algo en formato *. sav. SPSS puede leer los datos ASCII, que luego se pueden guardar en formato *. sav. El enfoque bsico a travs de los mens A continuacin se muestra, sin embargo, si usted est tirando de los archivos de datos de gran tamao de la web, por ejemplo, a travs de ICPSR, que va a utilizar la sintaxis que se proporciona normalmente. 4. Importar datos desde otros formatos de archivo SPSS permite al usuario para que abra directamente los datos en SPSS a partir de diferentes formatos de archivo. Por ejemplo, SPSS directamente se abrir Excel, SAS, Stata y los archivos *. dbf (database). El usuario slo tiene que hacer es ir al men Archivo, seleccione "Abrir", seleccione el tipo de archivo correcto en el "Tipo de archivo" del men desplegable y desplcese hasta el archivo que desea abrir. V. Opciones de men Como se puede ver arriba , hay varios mens disponibles y necesarios en el transcurso del anlisis. Para empezar, se sugiere que pasar algn tiempo la personalizacin de la salida de SPSS y las opiniones a su gusto con Editar / Opciones. El men Archivo es similar a otros (Windows), como es el meu Editar, y el ms utilizado para el investigador aplicado ser el de datos, transformacin, y Analizar los mens. Tenga en cuenta que muchos de los anlisis vienen con opciones de trazado especfico para ellos y que no estn disponibles en el men de grficos, pero como se mencion anteriormente, SPSS cuenta con capacidades grficas muy pobres en general. Una palabra de advertencia acerca de los mens. Slo porque usted puede hacer clic fcilmente su camino a travs de un anlisis, no quiere decir, a. Usted ha hecho nada de forma apropiada b. Su anlisis es ms valor que el papel que podra imprimir en. Los mens se pueden hacer ms fcil para obtener resultados, pero eso no significa que sea til. En resumen la produccin no analyis igual . En RSS hemos conseguido muchos clientes que vienen en el que han hecho clic en su camino a travs de los terribles resultados, que eran pobres, ya que fue directamente al anlisis. Que por supuesto se debe evitar.

VI. Ventajas y Disadvanatges Ventajas: SPSS ofrece una facilidad de uso que la mayora de los paquetes son slo ahora ponerse al da. Es popular, y sin embargo, que no es ciertamente una razn para elegir un paquete estadstico, muchos conjuntos de datos son fciles de cargar en l y otros programas pueden importar archivos de SPSS. A partir de la versin 16 y 17, ahora es compatible con R y Python (suponiendo que se instalan en la mquina), que puede darle la funcionalidad que de otra manera carece o sera demasiado torpe en su propia sintaxis. Desventajas: Slo para uso acadmico de SPSS se queda sobre todo detrs de SAS, R, e incluso tal vez otros que estn en la ms matemtica en vez de lado los datos estadsticos para el anlisis moderno (por ejemplo, los enfoques robustos y de fcil acceso bootstrapping a cabo en otros lugares no existen o son muy difciles de hacer, las pruebas bsicas de supuestos analticos menudo no estn disponibles). Su oferta de mens suelen ser los ms bsicos de un anlisis y, a veces carecen incluso entonces, y lo hace haciendo un anlisis inadecuado muy fcil. Los grficos por defecto son pobres y no son fcilmente adaptables para hacerlas mejores. Es caro, a veces ridculamente as (por ejemplo, muchos de sus complementos son gratis en otro lado o una parte de la base de instalacin de otros paquetes), y an cuando usted compra usted es realmente slo leasing, y su licencia definitivamente no es fcil de usar . A menudo hay problemas de compatibilidad con versiones anteriores. VII. Resumen SPSS ofrece un poco como un programa general de estadsticas, y es libre y ampliamente disponible para todos en el campus a travs de los laboratorios, y, si profesores calificados, o el personal para su uso personal. Hay tres archivos bsicos para trabajar con (aunque otros estn disponibles), y SPSS ha hecho mucho para desarrollar una interfaz grfica de usuario. Si usted es parcial a los enfoques GUI SPSS es, sin duda por delante de algunos, pero no todos, los dems en ese departamento, pero eso es lo nico que cuenta con ms de otros que probablemente un llamamiento a la investigadora acadmica aplicada. Si usted est buscando para obtener ayuda e informacin sobre SPSS, hay una gran cantidad de ella en la web debido a su popularidad, as que sintete libre para hacer la bsqueda por su cuenta. Usted encontrar que la mayora de los libros sobre el uso de SPSS ofrecen mucho menos de lo que es de libre y fcil de obtener en la web.

PRUEBAS DE SIGNOS.

La mayor parte de las tcnicas estudiadas hacen suposiciones sobre la composicin de los datos de la poblacin. Las suposiciones comunes son que la poblacin sigue una distribucin normal, que varias poblaciones tienen varianzas iguales y que los datos se miden en una escala de intervalos o en una escala de razn. Este tema presentar un grupo de tcnicas llamadas no pramtricas que son tiles cuando estas suposiciones no se cumplen. Porqu los administradores deben tener conocimientos sobre estadstica no paramtrica? La respuesta a esta pregunta es muy sencilla; las pruebas de ji cuadrada son pruebas no paramtricas. Tanto la prueba de la tabla de contingencia como la de bondad de ajuste analizan datos nominales u ordinales. Estas pruebas, se usan ampliamente en las aplicaciones de negocios, lo que demuestra la importancia de la habilidad para manejar datos categricos o jerarquizados adems de los cuantitativos. Existen otras muchas pruebas estadsticas diseadas para situaciones en las que no se cumplen las suposiciones crticas o que involucran datos cuantitativos o categricos. Los analistas que manejan estos datos deben familiarizarse con libros que abordan tales pruebas, conocidas comnmente como pruebas estadsticas no paramtricas. Se presentarn aqu unas cuantas de las pruebas no paramtricas que mas se usan. Qu ocurre con las pruebas no paramtricas frente a las que si lo son? Las pruebas no paramtricas nonecesitan suposiciones respecto a la composicin de los datos poblacionales. Las pruebas no paramtricas son de uso comn: 1.- Cuando no se cumplen las suposiciones requeridas por otras tcnicas usadas, por lo general llamadas pruebas paramtricas. 2.- Cuando es necesario usar un tamao de muestra pequeo y no es posible verificar que se cumplan ciertas suposiciones clave. 3.- Cuando se necesita convertir datos cualitativos a informacin til para la toma de decisiones.

Existen muchos casos en los que se recogen datos medidos en una escala nominal u ordinal. Muchas aplicaciones de negocios involucran opiniones o sentimientos y esos datos se usan de manera cualitativa. Las pruebas no paramtricas tienen varias ventajas sobre las pruebas paramtricas: 1.- Por lo general, son fciles de usar y entender. 2.- Eliminan la necesidad de suposiciones paramtricas. 3.- Se pueden usar con muestras pequeas. 4.- Se pueden usar con datos cualitativos. Tambin las pruebas no paramtricas tienen desventajas: 1.- A veces, ignoran, desperdician o pierden informacin. 2.- No son tan eficientes como las paramtricas. 3.- Llevan a una mayor probabilidad de no rechazar una hiptesis nula falsa (incurriendo en un error de tipo II). Las pruebas no paramtricas son pruebas estadsticas que no hacen suposiciones sobre la constitucin de los datos de la poblacin. Por lo general, las pruebas paramtricas son mas poderosas que las pruebas no paramtricas y deben usarse siempre que sea posible. Es importante observar, que aunque las pruebas no paramtricas no hacen suposiciones sobre la distribucin de la poblacin que se muestrea, muchas veces se apoyan en distribuciones muestrales como la normal o la ji cuadrada. EL CONTRASTE DE SIGNOS. La prueba de los signos es quiz la prueba no paramtrica mas antigua. En ella est, basadas muchas otras. Se utiliza para contrastar hiptesis sobre el parmetro de centralizacin y es usado fundamentalmente en el anlisis de comparacin de datos pareados. Consideremos una muestra aleatoria de tamao n tal que sus observaciones estn o puedan estar clasificadas en dos categoras: 0 y 1, + y -, . etc. restrictivas de las pruebas

Podemos establecer hiptesis acerca de la mediana, los centiles, cuartiles, etc. Sabemos que la mediana deja por encima de s tantos valores como por debajo; Considerando que Xi - Mdn > 0 , darn signos positivos (+) y Xi - Mdn < 0 signos negativos (-) , en la poblacin original tendremos tantos (+) como (-). Se tratara de ver hasta que punto el numero de signos (+) esta dentro de lo que cabe esperar que ocurra por azar si el valor propuesto como mediana es verdadero. Lo mismo se puede decir respecto a los cuartiles, centiles, o deciles. Teniendo en cuenta que se trabaja con dos clases de valores, los que estn por encima y los que estn por debajo, es decir, los (+) y los (-) , los estadsticos de contraste seguirn la distribucin binomial, si se supone independencia y constancia de probabilidad en el muestreo. La mejor forma de entender este apartado es mediante un ejemplo practico; De modo que en la tabla que pondremos a continuacin se pueden ver los resultados de un experimento sobre comparacin de sabores. Un fabricante de alubias esta considerando una nueva receta para la salsa utilizada en su producto. Eligio una muestra aleatoria de ocho individuos y a cada uno de ellos le pedio que valorara en una escala de 1 a 10 el sabor del producto original y el nuevo producto. Los resultados se muestran en la tabla, donde tambin aparecen las diferencias en las valoraciones para cada sabor y los signos de estas diferencias. Es decir, tendremos un signo + cuando el producto preferido sea el original, un signo cuando el preferido sea el nuevo producto y un 0 si los dos productos son valorados por igual. En particular en este experimento, dos individuos han preferido el producto original y cinco el nuevo; Uno los valoro con la misma puntuacin. La hiptesis nula es que ninguno de los dos productos es preferido sobre el otro. Comparamos las valoraciones que indican la preferencia por cada producto, descartando aquellos casos en los que los dos productos fueron valorados con la misma puntuacin. As el tamao muestral efectivo se reduce a siete, y la nica informacin muestral en que se basara nuestro contraste ser la de los dos individuos de los siete que prefirieron el producto original. La hiptesis nula puede ser vista como aquella en la que la media poblacional de las diferencias sea 0. Si esta hiptesis fuese cierta, nuestra sucesin de diferencias + y - podra ser considerada como una muestra aleatoria de una poblacin en la que las probabilidades de + y - fueran cada una 0,5. En este caso, las observaciones constituiran una muestra aleatoria de una poblacin con una distribucin binomial, con probabilidad de + 0,5. Es decir, si p representa la verdadera proporcin en la poblacin de +,la hiptesis nula ser: H0: p = 0,5

Podemos querer contrastar esta hiptesis bien frente alternativas unilaterales, bien frente a alternativas bilaterales. Supongamos que en el ejemplo de preferencias por los sabores la hiptesis alternativa es que en la poblacin, la mayora de las preferencias son por el nuevo producto. Esta alternativa se expresa como: H1: p < 0,5 Tabla: INDIVIDUO VALORACION PRODUCTO ORIGINAL A B C D E F G H 6 4 5 8 3 6 7 5 PRODUCTO NUEVO 8 9 4 7 9 9 7 9 -2 -5 1 1 -6 -3 0 -4 + + 0 DIFERENCIA SIGNO DE LA DIFERENCIA

Al contrastar la hiptesis nula frente a esta alternativa, nos preguntamos, Cul es la probabilidad de observar en la muestra un resultado similar a aquel que se observara si la hiptesis nula fuese, de hecho, cierta? Si representamos por P(x) la probabilidad de observar x Exitos (+) en una binomial de tamao 7 con probabilidad de xito 0,5, la probabilidad de observar dos o menos + es: P(0)+P(1)+P(2) = 0,0078 + 0,0547 + 0,1641 = 0,2266 Por tanto, si adoptamos la regla de decisin rechazar H0 si en la muestra tenemos dos o menos + , la probabilidad de rechazar la hiptesis nula cuando en realidad de cierta ser de 0,2266. Dicho contraste tiene un nivel de significacin del 22,66 % y , en nuestro ejemplo, la hiptesis nula podr ser rechazada a dicho nivel. Es importante tambin preguntarse a que nivel dejaremos de rechazar la hiptesis nula. Si hubisemos tenido la regla de decisin ningn + o un + para rechazar, H0 no hubiera sido rechazada. El nivel de significacin de este nuevo test es: P(0)+P(1) = 0,0625

La hiptesis nula no ser rechazada a un nivel de significacin del contraste del 6,25 %. La hiptesis nula de que en la poblacin las preferencias por un producto u otro son iguales es rechazada contra la hiptesis alternativa de que la mayora de la poblacin prefiere el nuevo producto utilizando un test con nivel de significacin del 22,66% . Si embargo la hiptesis nula no puede ser rechazada utilizando el test con nivel de significacin del 6,25%. Por tanto, estos datos muestran una modesta evidencia contra la hiptesis nula de que la poblacin tenga preferencias iguales por un producto u otro, aunque dicha evidencia no es muy grande. En nuestro caso, esto puede ser una consecuencia del pequeo tamao muestral. Tenemos que considerar el caso en el que la hiptesis alternativa sea bilateral, es decir: H1: p " 0,5 En nuestro ejemplo, esta hiptesis significa que la poblacin puede preferir uno u otro producto. Si las alternativas a cada valor postulado por la hiptesis nula son tratados de forma simtrica, una regla de decisin que nos conducira a rechazar la hiptesis nula para estos datos seria rechazas Ho si la muestra contiene dos o menos, o cinco o mas +. El nivel de significacin para este contraste es: P(0) + P(1) + P(2) + P(5) + P(6) + P(7) = 2 [P(0) + P(1) + P(2)] = 0.4532 Ya que la funcin de probabilidad de la distribucin binomial es simtrica para p = 0,5. La hiptesis nula no ser rechazada si no tomamos como regla de decisin rechazar H0 si la muestra contiene dos o menos o seis o mas +s.Este contraste tiene nivel de significacin: P(0) + P(1) + P(6) + P(7) = 2 [ P(0) + P(1)] = 0,1250 Por tanto, a un nivel de significacin del contraste del 12,5 %, la hiptesis nula de que la mitad de los miembros de la poblacin con alguna preferencia prefieren el nuevo producto no ser rechazado frente a la hiptesis alternativa bilateral. El contraste de signos puede ser utilizado para contrastarla hiptesis nula de que la mediana de una poblacin es 0. Supongamos que tomamos una muestra aleatoria de una poblacin y eliminamos aquellas observaciones iguales a 0, quedando en total n observaciones. La hiptesis nula a contrastar ser que la proporcin p de observaciones positivas en la poblacin es 0,5 es decir: H0 : p = 0,5

En este caso, el contraste estar basado en el hecho de que el numero de observaciones positivas en la muestra tiene una distribucin binomial ( p = 0,5 bajo la hiptesis nula). Si el tamao muestral es grande, se podr utilizar la aproximacin de la distribucin binomial a la normal para realizar el contraste de signos. Esta es una consecuencia del teorema central del lmite. Si el numero de observaciones no iguales a 0 es grande, el contraste de signos esta basado en la aproximacin de la binomial a la normal. El contraste es: H0 : p = 0,5 EJEMPLO A una muestra aleatoria de cien nios se les pidi que comparasen dos nuevos sabores de helados: vainilla y fresa. 56 de los nios prefirieron el sabor a vainilla, 40 prefirieron el sabor a fresa, y a 4 de ellos les daba igual. Se quiere contrastar frente a una alternativa bilateral la hiptesis nula de que no existe en la poblacin una preferencia por un sabor u otro. Si p es la proporcin de nios en la poblacin que prefieren el sabor a vainilla, lo que queremos contrastar es H0: p=0,5 frente a H1: p"0,5. Como cuatro de los nios no han preferido un sabor a otro, tenemos un tamao muestral de 96 nios. La proporcin de nios que han preferido el sabor a vainilla es: Px = 56 / 96 = 0,583 Para un nivel de significacin Px - 0,5 Rechazar H0 si -------------------- < -Z "(0,5)(0,5) / n Px - 0,5 -------------------- > -Z /2 /2 , la regla de decisin es:

"(0,5)(0,5) / n En nuestro caso Px - 0,5 0,583 - 0,5 -------------------- = ------------------------ = 1,63 "(0,5)(0,5) / n "(0,5)(0,5) / 96 Vemos, que si Z /2 = 1,63, /2 = 0,0516, de manera que = 0,1032. Por tanto, la hiptesis nula podr ser rechazada para todos los niveles de significacin superiores al 10,32%. Si la hiptesis nula de que el mismo nmero de nios prefieren el sabor a vainilla que el sabor a fresa fuese cierta, la probabilidad de observar unos resultados maestrales tan extremos, o mas extremos que los actualmente obtenidos, ser ligeramente superior a uno sobre diez. En nuestro caso, los datos muestran una modesta evidencia en contra de dicha hiptesis. La figura muestra las probabilidades de las colas de una distribucin normal correspondientes al 5,16% inferior y superior del rea total bajo la funcin de densidad.

PRUEBA DE LOS SIGNOS DE WILCOXON.


La prueba de los signos de Wilcoxon es una prueba no paramtrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas. Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras. Debe su nombre a Frank Wilcoxon, que la public en 1945. Se utiliza cuando la variable subyacente es continua pero presupone ningn tipo de distribucin particular.

Planteamiento.
Supngase que se dispone de n pares de observaciones, denominadas (xi,yi). El objetivo del test es comprobar si puede dictaminarse que los valores xi e yi son o no iguales. 1. Si zi = yi xi, entonces los valores zi son independientes. 2. Los valores zi tienen una misma distribucin continua y simtrica respecto a una mediana comn .

Mtodo.
La hiptesis nula es H0: = 0. Retrotrayendo dicha hiptesis a los valores xi,yi originales, sta vendra a decir que son en cierto sentido del mismo tamao. Para verificar la hiptesis, en primer lugar, se ordenan los valores absolutos y se les asigna su rango Ri. Entonces, el estadstico de la prueba de los signos de Wilcoxon, W + , es

Es decir, la suma de los rangos Ri correspondientes a los valores positivos de zi. La distribucin del estadstico W + puede consultarse en tablas para determinar si se acepta o no la hiptesis nula. En ocasiones, esta prueba se usa para comparar las diferencias entre dos muestras de datos tomados antes y despus del tratamiento, cuyo valor central se espera que sea cero. Las diferencias iguales a cero son eliminadas y el valor absoluto de las desviaciones con respecto al valor central son ordenadas de menor a mayor. A los datos idnticos se les asigna el lugar medio en la serie. la suma de los rangos se hace por separado para los signos positivos y los negativos. S representa la menor de esas dos sumas. Comparamos S con el valor proporcionado por las tablas estadsticas al efecto para determinar si rechazamos o no la hiptesis nula, segn el nivel de significacin elegido.

PRUEBA U DE MANN-WHITNEY.
En estadstica la prueba U de Mann-Whitney (tambin llamada de Mann-WhitneyWilcoxon, prueba de suma de rangos Wilcoxon, o prueba de Wilcoxon-MannWhitney) es una prueba no paramtrica aplicada a dos muestras independientes. Es, de hecho, la versin no paramtrica de la habitual prueba t de Student. Fue propuesto inicialmente en 1945 por Frank Wilcoxon para muestras de igual tamaos y extendido a muestras de tamao arbitrario como en otros sentidos por Henry B. Mann y D. R. Whitney en 1947.

Planteamiento de la prueba.
La prueba de Mann-Whitney se usa para comprobar la heterogeneidad de dos muestras ordinales. El planteamiento de partida es: 1. Las observaciones de ambos grupos son independientes 2. Las observaciones son variables ordinales o continuas. 3. Bajo la hiptesis nula, las distribuciones de partida de ambas distribuciones es la misma

4. Bajo la hiptesis alternativa, los valores de una de las muestras tienden a exceder a los de la otra: P(X > Y) + 0.5 P(X = Y) > 0.5.
Clculo del estadstico

Para calcular el estadstico U se asigna a cada uno de los valores de las dos muestras su rango para construir

donde n1 y n2 son los tamaos respectivos de cada muestra; R1 y R2 es la suma de los rangos de las observaciones de las muestras 1 y 2 respectivamente. El estadstico U se define como el mnimo de U1 y U2. Los clculos tienen que tener en cuenta la presencia de observaciones idnticas a la hora de ordenarlas. No obstante, si su nmero es pequeo, se puede ignorar esa circunstancia.

Distribucin del estadstico.


La prueba calcula el llamado estadstico U, cuya distribucin para muestras con ms de 20 observaciones se aproxima bastante bien a la distribucin normal. La aproximacin a la normal, z, cuando tenemos muestras lo suficientemente grandes viene dada por la expresin: z = (U mU) / U Donde mU y U son la media y la desviacin estndar de U si la hiptesis nula es cierta, y vienen dadas por las siguientes frmulas: mU = n1n2 / 2.

También podría gustarte