Está en la página 1de 25

Prueba de rangos con signo de Wilcoxon

independientes

No es necesario que las muestras provengan de poblacion


Ejemplo

Los datos que se muestran corresponden al Índice de Masa


mujeres que participan en un taller de Nutrición. Utilice
0,05 para probar la aseveración de que la mediana del IMC
igual.

Varones 25,2 38,1 27,8 22,0


Mujeres 17,7 20,5 22,0 19,2

Rangos Ordenando datos


Ho: Mediana V=mediana M
1 16.1
2 17.4
H1: Mediana V≠mediana M
3 17.7
4 18.2
5 18.69 Varones Rangos V Mujeres
6 19.2 25.2 16
7 20.5 38.1 23
8 20.7 27.8 19
9 20.9 22 11.5
10 21.5 26.4 17
11.5 22 31.4 22
11.5 22 21.5 10
13 22.5 28.1 20
14 25 25.1 15
15 25.1 30.5 21
16 25.2 27.5 18
17 26.4 Suma de rangos 192.5
18 27.5
19 27.8 media rangos= 132
20 28.1 Desv rangos= 16.2480768
21 30.5 Zprueba= 3.7235176
22 31.4 Zcrìtico= 1.95996398
23 38.1
0.025
Rho

Con una confianza del 95% se


medianas de los indices de m
varones y mujeres son difere
de Wilcoxon para muestras

ovengan de poblacionales normales


al Índice de Masa Corporal (IMC) de varones y
Nutrición. Utilice un nivel de significación del
a mediana del IMC de los varones y mujeres es

26,4 31,4 21,5 28,1 25,1 30,5 27,5


20,7 18,6 16,1 17,4 22,5 25,0 18,2 20,9

2 COLAS

Rangos M
0.95 0.025
Aho Rho

-1.96 1.96 3.72

on una confianza del 95% se puede afirmar que las


medianas de los indices de masa corporales de tanto de
arones y mujeres son diferentes
1. El administrador del café-bar: “Koki” tiene la sospecha de que los gastos que realizan
sus clientes es diferente en sus tres sucursales. Por lo que seleccionó aleatoriamente a 4
clientes de la sucursal 1, luego a 3 de la sucursal 2 y a 5 clientes de la sucursal 3 y se
registraron los gastos (en soles) que realizaron en un cierto día. Aquí los resultados:

Sucursal 1 28 58 46 29
Sucursal 2 26 54 42
Sucursal 3 23 28 45 30 38

Con un nivel de significancia de , los datos obtenidos apoyan la sospecha del administrador. Cabe
señalar que las muestras fueron extraídas de poblaciones aproximadamente normales con varianzas iguales. (5
Puntos)

Ho: Los gastos medios de las diferentes sucursales son iguales.


H1: Al menos un gasto promedio es difrente a los demás

O. Variaciones Suma de C. G libertad Prom Cuadr F prueba


E grupos 170.033333 2 85.0166667 0.57868731
D grupos 1322.21667 9 146.912963
Total

S1 S2 S3
28 26 23 0.90
58 54 28 AHo
46 42 45
29 30
38
Media 40.25 40.6666667 32.8 37.25
Gran media

Suma Cuadr E 170.033333


Suma Cuadr D 624.75 LA SOSPECHA DEL ADMIN
394.666667
302.8
1322.21667

Existe suficiente evidencia muestral para concluir con una confianza del 90% que los promedios de los gastos
de los clientes son iguales, enctonces gastan los mismo en todas sus sucursales.

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
S1 4 161 40.25 208.25
S2 3 122 40.6666667 197.333333
S3 5 164 32.8 75.7

ANÁLISIS DE VARIANZA
Origen de las variaciones
Suma de cuadrados
Grados de
Promedio
libertad de los cuadradosF Probabilidad
Valor crítico para F
Entre grupos 170.0333333333 2 85.0166667 0.57868731 0.58019593 3.00645242
Dentro de los 1322.216666667 9 146.912963

Total 1492.25 11
0.90
AHo
0.10
RHo

0.5787 3.00645242

A SOSPECHA DEL ADMINISTRADOS NO ES CORRECTA


1. Un editor de periódicos que trata de determinar con precisión las características de su mercado, se pregunta si la costumbre de le
educativo de las personas. Pregunta a los adultos acerca de su nivel educativo y la frecuencia con que leen el periódico. Los resultad

Nivel educativo
Frecuencia Secundaria
Titulado Bachiller
con la que lee Posgrado completa
Nunca 10 17 11 21
Algunas veces 12 23 8 5
Mañana o tarde 35 38 16 7
Dos periódicos al día 28 19 6 13

A un nivel de significación de 0,10. ¿La frecuencia con que leen el periódico en la ciudad difiere con el nivel de educación de los lecto

Ho: La frecuencia con que se leen el periodico es independiente (no se relacion

H1: La frecuencia con que se lee el periodico no es independiente con el nivel d

Nivel educ
Posgrado Titulado
fobservada (fo) fe fo
Frecuencia con la que lee
Nunca 10 18.6431227 17
Algunas veces 12 15.1672862 23
Mañana o tarde 35 30.3345725 38
Dos periodicos al dia 28 20.8550186 19
85 85 97

fe=(total fila*to

4.0070309518
0.6614038924
0.717538177
2.4478884626
0.8590523986
1.8714797391
0.3305883443
0.9677975865
0.4481252046
0.0639526098
0.1279052196
1.6381935229
11.7992414384
1.2539211923
5.4011847759
0.2602242728
Chi prueba= 32.8555277884

Grados de libertad=(filas-1)*(columnas -1)

gl= 2

AHo
0.90 RHo
0.10

14.684 32.8555

14.6836566

Con una confianza del 90%


La frecuencia con que se lee el periodico no es independiente con el nivel de educacion de los
lectores.
egunta si la costumbre de leer diarios en su ciudad se relaciona con el nivel
en el periódico. Los resultados se muestran en la siguiente tabla:

vel de educación de los lectores? (5 puntos)

endiente (no se relaciona) con el nivel de educacion de los lectores

pendiente con el nivel de educacion de los lectores

Nivel educativo
Titulado Bachiller Secundaria completa
fe fo fe fo fe

21.2750929 11 8.99256506 21 10.0892193 59


17.3085502 8 7.31598513 5 8.20817844 48
34.6171004 16 14.6319703 7 16.4163569 96
23.7992565 6 10.0594796 13 11.2862454 66
97 41 41 46 46 269 269
Gran total

fe=(total fila*total columna)/gran total


l de educacion de los
1. Las materias primas empleadas en la producción de una fibra sintética son almacenadas en un lugar donde no se tiene control so
humedad de una muestra de las materias primas (Y) (ambas en porcentaje) para 12 días se presenta en la siguiente tabla.

Humedad en el
42 35 50 43
almacenamiento (%)

Humedad en la
12 8 14 9
materia prima (%)

Estime e interprete con un nivel de confianza del 90%, para la humedad promedio en la materia prima, cuando se tiene una humeda

Humedad en el Humedad en la
almacenaniento (X) materia prima (Y)
1 42 12
2 35 8
3 50 14
4 43 9
5 48 11
6 62 16
7 31 7
8 36 9
9 44 12
10 39 10
11 55 13
12 48 11

r de Pearson
n xy   x  y
r
n  x 2
  x
2
n y 2
 

H.
H. almacena. materia xy
(x) prima (y)
42 12 504
35 8 280
50 14 700
43 9 387
48 11 528
62 16 992
31 7 217
36 9 324
44 12 528
39 10 390
55 13 715
48 11 528
533 132 6093

r^2= 0.836181 83.61%

PRUEBA DE HIPÓTESIS (alfa


Ho: p=0 (rho) No hay correlación
H1: p≠0 (rho) Si existe correlación

0.90
0.05 RHo AHo

-1.812
H.
H. almacena. materia
(x) prima (y) Ventas esperadas

f) 1 42 12 11.1555
2 35 8
3 50 14
4 43 9
5 48 11
6 62 16
7 31 7
8 36 9
9 44 12
10 39 10
11 55 13
12 48 11

ERROR ESTÁNDAR

s=

INTERVALO DE CONFIANZA

1 ( x  x) 2
yest  t / 2; n  2 s yx 
x2  
n ( x
 n

H. almacena. H. materia x^2 y^2


(x) prima (y)
42 12 1764 144
35 8 1225 64
50 14 2500 196
43 9 1849 81
48 11 2304 121
62 16 3844 256
31 7 961 49
36 9 1296 81
44 12 1936 144
39 10 1521 100
55 13 3025 169
48 11 2304 121

Lim inferior= 10.98080935 copiadoras


Lim superior=9.716190653 copiadoras
r donde no se tiene control sobre la humedad. Las mediciones de la humedad relativa en el lugar de almacenamiento (X) y la
n la siguiente tabla.

48 62 31 36 44 39 55 48

11 16 7 9 12 10 13 11

, cuando se tiene una humedad de almacenamiento de 45%. (5 puntos)

 x y
n y    y 2 2

x^2 y^2

1764 144
1225 64
2500 196
1849 81
2304 121
3844 256
961 49
1296 81
1936 144
1521 100
3025 169
2304 121
24529 1526

r= 0.91443

HIPÓTESIS (alfa= 0.10 )


hay correlación
iste correlación

Grados de libertad: n-2

7.14443067
0.90
AHo 0.05 RHo

7.144
1.812

b= 0.26903
a= -0.9495
ÁNDAR

1.101

( x  x) 2
( x ) 2
x 
2

xy
y estimado
504 10.3485
280 8.4655
700 12.5005
387 10.6175
528 11.9625
992 15.7285
217 7.3895
324 8.7345
528 10.8865
390 9.5415
715 13.8455
528 11.9625

El promedio de humedad en la materia prima, cuando se


tiene humedad de almacenamiento de 45% se encuentra
entre 10.98 y 9.72,de humedad en la materia prima, con
una confianza del 90%.
4. El registro anual de la venta de aspiradoras de una marca especifica en el período 2007-2016 se presenta en la tabla siguiente:
Año Ventas
1 2592
2 2748
3 2360
4 2576
5 2963
6 3395
7 3200
8 3082
9 3396
10 3781

Nota: Los años se han codificado desde: 1=2007 hasta 2016=10


· Con base en las estadísticas de resumen ¿Qué modelo de regresión ajusta mejor a los datos? ¿Por qué? (4 puntos)
· Utilice el modelo elegido para calcular las ventas esperadas para el año 2017 (1 punto)

AÑO (x) ESTUDIANTES (y) modelo r^2=R^2


1 2592 lineal 75.76%
2 2748 exponencial 74.78%
3 2360 logarítmico 59.45%
4 2576 polinomial 78.05%
5 2963 potencial 59.45%
6 3395
7 3200 Por que la R es mayor que todos los
8 3082 y = 8.803x2 + 31.355x + 2497.9
9 3396 R² = 0.7805
10 3781
2017= 11 y esperado= 3907.968

LINEAL
4000
4000
3500 f(x) = 128.1878787879x + 2304.2666666667 3500 f(x) = 8.
R² = 0.7576117885 R² = 0.7
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0
0 2 4 6 8 10 12 0
0 2
1000

500

0
0 2
E P
X O N N
E C A
I L

Exponencial
4000 4000
3500 f(x) = 2359.4255841989 exp( 0.0424335095 x ) 3500
R² = 0.7477905972 f(x)
3000 3000 R² =
2500 2500

2000 2000

1500 1500

1000 1000

500 500

0 0
0 2 4 6 8 10 12 0

Logaritmica
4000

3500
f(x) = 469.4595947715 l n(x) + 2300.2088594182
3000 R² = 0.5956265262

2500

2000

1500

1000

500

0
0 2 4 6 8 10 12
a en la tabla siguiente:

r qué? (4 puntos)

MEJOR

es mayor que todos los otros modelos y se acerca al 100%

3907.968

Polinomica
4000

3500 f(x) = 8.803030303x^2 + 31.3545454545x + 2497.9333333333


R² = 0.7804781554
3000

2500

2000

1500

1000

500

0
0 2 4 6 8 10 12
1000

500

0
0 2 4 6 8 10 12

Potencial
4000

3500
f(x) = 2353.185563114 x^0.1562672662
3000 R² = 0.5944603811
2500

2000

1500

1000

500

0
0 2 4 6 8 10 12

También podría gustarte