Está en la página 1de 14

Curso de Estadística no-paramétrica

Sesión 2: Inferencia no Paramétrica para variables continuas

David Conesa

Grup d’Estadística espacial i Temporal Departament d’Estadística


en Epidemiologia i Medi Ambient i Investigació Operativa

Universitat de València

Junio 2013

Introducción Muestras independientes Muestras relacionadas

Comparación de muestras aleatorias de variables continuas

En la sesión anterior hemos visto el análisis de una muestra de datos


cuantitativos para hacer inferencia acerca de la localización de la población
de la cual se había obtenido la muestra.
Sin embargo, en muchas situaciones prácticas la investigación involucra la
comparación de dos o más muestras obtenidas de diferentes poblaciones.
En esta sesión abordamos métodos no paramétricos para la comparación de
dos o más muestras que nos permitan realizar inferencia acerca de algunos
aspectos relevantes de las poblaciones de las cuales provienen.
Dos situaciones:
1 Las muestras se obtienen de forma aleatoria e independientemente de
sus respectivas poblaciones. Los datos de la primera muestra no
influyen en la elección de los datos de la segunda.
2 Los datos de la segunda muestra han sido elegidos teniendo en cuenta
como se han elegido los de la primera, teniendo así un conjunto de
pares de cada dato de la primera muestra con su correspondiente dato
en la segunda.
2 / 28
Introducción Muestras independientes Muestras relacionadas

Comparación de dos muestras independientes

Cuando queremos comparar el valor central de dos muestras independientes


utilizamos el test de Mann-Whitney.
Por ser un test no paramétrico, a diferencia del test t, el de Mann-Whitney es
válido sin importar las formas de las distribuciones de las poblaciones de las que
proceden las dos muestras.
Es decir, no necesita de la normalidad de las muestras ni tampoco que ambas
muestras vengan de poblaciones con igual varianza (homogeneidad de varianzas no
necesaria).
Además, no usa los valores de los datos de las muestras sino sólo sus posiciones
relativas, lo que puede ser una ventaja y una desventaja. Por una parte, esto lo
hace más flexible, pero por otra parte, puede ser ineficiente ya que no utiliza toda
la información de los datos. Esta ineficiencia es evidente especialmente para
muestras pequeñas.
Ninguno de los dos tests es claramente superior al otro.
Si las distribuciones no son normales el test t no es válido.
Mann-Whitney funciona mejor t si las distribuciones son muy sesgadas.
Para distribuciones normales con la misma varianza el test t es la mejor elección.
Para muestras de tamaño moderado Mann-Whitney funciona igual que test t.
3 / 28

Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras independientes

Test de Mann-Whitney
Analizar/Tests no paramétricos/muestras independientes...

4 / 28
Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras independientes

Test de Mann-Whitney
Analizar/Tests no paramétricos/muestras independientes...

5 / 28

Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras independientes

Test de Mann-Whitney
Analizar/Tests no paramétricos/muestras independientes...

6 / 28
Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras independientes

Test de Mann-Whitney
Analizar/Tests no paramétricos/muestras independientes...

7 / 28

Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras independientes

Test de Mann-Whitney
Analizar/Tests no paramétricos/Cuadros de dialogo antiguos/2 muestras
independientes...

8 / 28
Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras independientes

Test de Mann-Whitney
Analizar/Tests no paramétricos/Cuadros de dialogo antiguos/2 muestras
independientes...

9 / 28

Introducción Muestras independientes Muestras relacionadas

Ejemplos

Ejemplos
1 Se observa el capital social de 5 empresas valencianas y se quiere ver si el valor
central es superior al de 5 empresas catalanas. ¿Están los datos de acuerdo con
dicha suposión?

Valencianas 49 60 69 45 23
Catalanas 57 53 96 35 57

2 Se analizan las pérdidas de 5 empresas sometidas a vigilancia con respecto a otras


6 empresas que no han sido sometidas a vigilancia externa. ¿Hay evidencia de que
las vigiladas tienen menos pérdidas?
Vigiladas 6 7 11 5 7
No vigiladas 16 12 7 14 7 10

10 / 28
Introducción Muestras independientes Muestras relacionadas

Comparación de dos o más muestras independientes

La prueba de Kruskal-Wallis es el equivalente no paramétrico de un


diseño de un análisis de varianza de un factor.
Contrasta la hipótesis nula de que las k variables analizadas (las k
muestras) procedan de la misma población.
Todos los datos obtenidos se ordenan según su rango. El estadístico
de contraste se basa en esta ordenación.

11 / 28

Introducción Muestras independientes Muestras relacionadas

Análisis de dos o más muestras independientes

Test de Kruskal-Wallis
Analizar/Tests no paramétricos/muestras independientes...

12 / 28
Introducción Muestras independientes Muestras relacionadas

Análisis de dos o más muestras independientes

Test de Kruskal-Wallis
Analizar/Tests no paramétricos/Cuadros de dialogo antiguos/K muestras
independientes...

13 / 28

Introducción Muestras independientes Muestras relacionadas

Análisis de dos o más muestras independientes

Test de Kruskal-Wallis
Analizar/Tests no paramétricos/Cuadros de dialogo antiguos/K muestras
independientes...

14 / 28
Introducción Muestras independientes Muestras relacionadas

Ejemplos

Ejemplos
1 Se analizan las pérdidas de 5 empresas diferentes en cada una de las
tres provincias valencianas. ¿Hay evidencia de que las pérdidas son
diferentes en las tres provincias?
Alicante 61 27 110 56 73
Castellón 160 12 17 174 7
Valencia 10 102 170 14 71

15 / 28

Introducción Muestras independientes Muestras relacionadas

Comparación de dos muestras relacionadas

En un diseño emparejado, las observaciones se presentan por parejas; las


unidades observacionales de un par está relacionadas entre sí de alguna
manera, de forma que tienen en común entre ellas dos algo que no tienen
con los miembros de los demás pares.
El diseño emparejado, si está bien realizado, es mejor que el correspondiente
diseño de muestras independientes.
Cuando queremos comparar el valor central de dos muestras independientes
utilizamos el test de los signos.
Por ser un test no paramétrico, a diferencia del test t, el de los signos es
válido sin importar las formas de las distribuciones de las poblaciones de las
que proceden las dos muestras.
Además, no usa los valores de los datos de las muestras sino sólo si la
diferencia entre las parejas es positiva o negativa.

16 / 28
Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras relacionadas

Test de los signos


Analizar/Tests no paramétricos/muestras relacionadas...

17 / 28

Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras relacionadas

Test de los signos


Analizar/Tests no paramétricos/muestras relacionadas...

18 / 28
Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras relacionadas

Test de los signos


Analizar/Tests no paramétricos/muestras relacionadas...

19 / 28

Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras relacionadas

Test de los signos y de Wilcoxon


Analizar/Tests no paramétricos/muestras relacionadas...

20 / 28
Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras relacionadas


Test de los signos y de Wilcoxon
Analizar/Tests no paramétricos/Cuadros de dialogo antiguos/2 muestras
relacionadas...

21 / 28

Introducción Muestras independientes Muestras relacionadas

Análisis de dos muestras relacionadas

Test de los signos y de Wilcoxon


Analizar/Tests no paramétricos/Cuadros de dialogo antiguos/2 muestras
relacionadas...

22 / 28
Introducción Muestras independientes Muestras relacionadas

Ejemplos

Ejemplos
1 Siete empresas familiares voluntarias participaron en un estudio para determinar si
una campaña publicitaria podría elevar las ventas anuales de la empresa. Se
midieron las ventas dos veces, una antes de la campaña y otra después. A la vista
de los resultados, ¿hay evidencia para decir que mejoran las ventas?
EMPRESAS Antes Después Diferencia
1 46 56 10
2 47 52 5
3 41 47 6
4 45 48 3
5 37 37 0
6 48 51 3
7 58 62 4

2 Se pretende analizar el impacto de una crisis en el comportamiento de seis valores


negociados en bolsa. Para ello se observa el valor antes de una fecha clave y 5
meses después de dicha fecha. ¿Hay evidencia de que los valores han bajado?
V1 V2 V3 V4 V5 V6
Previo crisis 6.2 7.6 11.3 5.3 7.2 8.6
Tras crisis 3.4 1.2 7.9 1.4 7.1 10.1
23 / 28

Introducción Muestras independientes Muestras relacionadas

Comparación de dos o más muestras relacionadas

La prueba de Friedman es el equivalente no paramétrico de un diseño


de medidas repetidas o de bloques completos aleatorizados.
El test de Friedman contrasta la hipótesis nula de que las k variables
relacionadas procedan de la misma población.
En cada caso, las k variables se ordenan en un rango de 1 a k. El
estadístico de contraste se basa en estos rangos.

24 / 28
Introducción Muestras independientes Muestras relacionadas

Análisis de varias muestras relacionadas

Test de Friedman
Analizar/Tests no paramétricos/muestras relacionadas...

25 / 28

Introducción Muestras independientes Muestras relacionadas

Análisis de varias muestras relacionadas


Test de Friedman
Analizar/Tests no paramétricos/Cuadros de dialogo antiguos/K muestras
relacionadas...

26 / 28
Introducción Muestras independientes Muestras relacionadas

Análisis de varias muestras relacionadas


Test de Friedman
Analizar/Tests no paramétricos/Cuadros de dialogo antiguos/K muestras
relacionadas...

27 / 28

Introducción Muestras independientes Muestras relacionadas

Ejemplos

Ejemplos
1 Para valorar el comportamiento de unas acciones se estudia su valor
en tres mercados diferentes. ¿Hay evidencia de que el precio de las
acciones es diferente en los tres mercados?
A1 A2 A3 A4 A5
Madrid 61 101 57 73 70
Nueva York 60 102 57 74 70.5
Frankfurt 60.5 102 58 74 71

28 / 28

También podría gustarte