Está en la página 1de 13

PRUEBAS DE HIPTESIS DE PROPORCIONES Y CHI CUADRADA

(VARIABLES NO-MTRICAS)
Como investigadores en muchas ocasiones estamos interesados en un fenmeno
cuyo comportamiento es expresado en porcentajes. Por ejemplo, podemos estar
interesados en probar si la proporcin de potenciales electores que planean votar
por el candidato del PRI es estadsticamente distinta de la proporcin que declar
preferir el candidato del PAN.
I. Prueba de Hiptesis de Proporciones para una Sola Muestra.
Una encuesta realizada por Bancomer a 35 clientes indic que un poco ms del 74
por ciento tenan un ingreso familiar de ms de $200,000 al ao. Si esto es cierto,
el banco desarrollar un paquete especial de servicios para este grupo. La
administracin quiere determinar si el porcentaje verdadero es mayor del 60 por
ciento antes de desarrollar e introducir este nuevo paquete de servicios. Los
resultados mostraron que 74.29 por ciento de los clientes encuestados reportaron
ingresos de $200,000 o ms al ao.
El procedimiento para la prueba de hiptesis de proporciones es el siguiente:
1. Especifica la hiptesis nula y alternativa.
Hiptesis Nula: H 0 P .60
Hiptesis Alternativa: H a P .60 ,
donde P = la proporcin de clientes con ingresos familiares anuales de $200,000
o ms.
2. Especfica el nivel de significacin, , permitido. Para una .05 , el valor
de tabla de Z para una prueba de una sola cola es igual a 1.64.
3. Calcula el error estndar de la proporcin especficada en la hiptesis nula.
sp

donde:

p (1 p )
n

p = proporcin especificada en la hiptesis nula.


n = tamao de la muestra.
Por consiguiente:

sp

0.60(1 0.60)
.0828
35

4. Calcula la estadstica de prueba:

( proporcin _ observada) ( proporcin _ H 0 )


sp
z

0.7429 0.60
1.73
0.0828

5. La hiptesis nula se rechaza porque el valor de la Z calculada es mayor que


el valor crtico Z . El banco puede concluir con un 95 por ciento de confianza
(1 .95) que ms de un 60 por ciento de sus clientes tienen ingresos
familiares de $200,000 o ms. La administracin puede introducir el nuevo
paquete de servicios orientado a este grupo.

El presidente del PRI en 1988, basado en su experiencia, sostiene que un 95% de


los votos para las elecciones presidenciales han sido a favor de su partido. Los
partidos de oposicin levantaron una muestra de1,100 electores y encontraron
que un 87% de ellos votara por el PRI. El presidente del PRI quiere probar la
hiptesis, con un nivel de significacin de 0.05, que el 95% de los votos son para
su partido.

Hiptesis Nula: H o : p 0.95


Hiptesis Alternativa: H a : p 0.95
Tamao de muestra: n=1,100
Nivel de Significacin = 0.05.
El primer paso es calcular el error estndar de la proporcin utilizando el valor
hipottico del porcentaje que histricamente vota por el PRI:

SE p

p (1 p )

0.95 * 0.05
0.0066
1100

Ahora slo es necesario construir el intervalo de confianza:


po 1.96 * SE p

0.95 1.96 * 0.0066 0.937 0.963

La proporcin de .87 de votos por el PRI en la encuesta no cae en la regin de


aceptacin, por lo tanto el presidente del PRI debe de preocuparse por que la
tendencia entre los votantes es a favorecer menos al PRI.

SEXO DEL PATRON

Valid

Hombre
Mujer
Total

Frequency
1634
314
1948

Percent
83.9
16.1
100.0

Valid
Percent
83.9
16.1
100.0

Cumulative
Percent
83.9
100.0

Probemos la hiptesis de que el porcentaje de microempresas cuyos dueos son


hombres captado por la ENAMIN es distinto de 88 por ciento.
Hiptesis Nula: H 0 P 0.88
Hiptesis Alternativa: H 0 P 0.88

sp

0.88(1 0.88)
.0074
1948

0.839 0.88
5.54
0.0074

La hiptesis nula se rechaza porque el valor de la Z calculada es menor que el valor


crtico Z de 1.96. Podemos concluir con un 95 por ciento de confianza (1 .95)
que la proporcin captada por la ENAMIN es estadsticamente distinta de 0.88.

II. Prueba de Hiptesis para Diferencias entre Dos Proporciones (Muestras


Independientes).
Algunas veces estamos interesados en analizar la diferencia entre las proporciones
de poblaciones de grupos con distintas caractersticas. Por ejemplo, pensemos que
la administracin de las tiendas Oxxo cree, sobre la base de una investigacin,
que el porcentaje de hombres que visitan sus tiendas 9 o ms veces al mes
(clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo mismo.
Las especificaciones requeridas y el procedimiento para probar esta hiptesis es
la siguiente:

1. Las hiptesis nula y alternativa son las siguientes:


H o PH PM 0 ,

la proporcin de hombres que reportan 9 o ms visitas por


mes es la misma o menor que la proporcin de mujeres que hacen lo mismo.
H a PH PM 0 ,

la proporcin de hombres que reportan 9 o ms visitas por


mes es mayor a la proporcin de mujeres que hacen lo mismo.
La informacin proporcionada es:
n H 45

nM 71

PH .58

PM .42

PH PM .58 .42 .16

2. Especifica el nivel de significacin de .05 . El valor crtico para la prueba


de una sola cola es de 1.64.
3. Estima el error estndar de la diferencia de las dos proporciones:

s p hm

1
1
P(1 P)

nH nM

donde:
P

n H PH nM PM
nH nM

PH = proporcin muestra de hombres (H)


PM = proporcin muestra de mujeres (M)
NH = tamao de muestra hombres
NM = tamao de muestra mujeres

Por lo tanto:
P

45(.58) 71(.42)
0.48
45 71

y
1
1
s p hm .48(1 .48)

0.10
45 71

4. Calcula de prueba estadstica:

(diferencia _ entre _ proporciones _ observadas) (diferencia _ entre _ proporciones _ H o )


s ph m
Z

(.58 .42) (0)


1.60
.10

La hiptesis nula es aceptada porque el valor de la Z calculada es menor que el


valor crtico Z. La administracin no puede concluir con un 95 por ciento de
confianza que la proporcin de hombres que visita 9 o ms veces los Oxxo es mayor
que la proporcin de mujeres.
SPSS no cuenta con procedimientos para hacer pruebas de hiptesis de
proporciones. Probemos si el porcentaje de hombres dueos de microempresas es
estadsticamente diferente del porcentaje de mujeres.

1634(83.9) 314(16.1)
72.97
1634 314

y
s p hm

1
1
..73(1 ..73)

0.0274
1634 314

(.839 .161) (0)


24.74
.0274

La hiptesis nula es rechazada porque el valor de la Z calculada es mayor que el


valor crtico Z. Podemos concluir que el porcentaje de hombres dueos de
microempresas es estadsticamente superior al porcentaje de mujeres propietarias de
microempresas.

III. Chi-Cuadrada
La mayora de la informacin que se trabaja en las ciencias sociales o
administrativas es de carcter no-mtrico nominal. Por lo mismo, muchas de las
tcnicas multivariadas ms populares, como la regresin lineal de mnimos
cuadrados, presentan serias limitaciones analticas.
Cmo analizar informacin nominal o categrica?
es una prueba estadstica no paramtrica para diferencias entre dos o ms
muestras donde frecuencias esperadas son comparadas en relacin con frecuencias
obtenidas.
2

se utiliza para hacer comparaciones entre frecuencias y no entre valores medios.

Prueba No Paramtrica: procedimiento estadstico que no adopta ningn supuesto


acerca de cmo se distribuye la caracterstica bajo estudio en la poblacin, y que
slo requiere datos nominales u ordinales.
Estas medidas son importantes porque la mayora de la informacin en la
investigacin social y administrativa es de carcter nominal u ordinal, y porque no
siempre estamos seguros que la caracterstica que deseamos estudiar se distribuye
normalmente en la poblacin.
La prueba de significacin 2 se refiere esencialmente a la distincin entre
frecuencias esperadas y frecuencias obtenidas.

Las frecuencias esperadas f e se refieren a los trminos de la hiptesis nula, segn


la cual la frecuencia relativa (o proporcin) se supone es la misma entre los dos
grupos.
Por ejemplo, si se espera que un 50% de los negocios que llevan una contabilidad
formal hayan iniciados sus actividades con ahorros personales, entonces tambin
esperamos un 50% de aquellos que empezaron con financiamiento externo.

Las frecuencias obtenidas f o se refieren a los resultados obtenidos en el estudio y


que, por consiguiente, pueden variar o no de un grupo a otro.
Slo si la diferencia entre las frecuencias observadas y obtenidas es suficientemente
grande, se rechaza la hiptesis nula, y se concluye que existe una diferencia real en
la poblacin.
Como resultado, la hiptesis nula para la 2 seala que las poblaciones o grupos
no difieren con respecto a la frecuencia de ocurrencia de una caracterstica dada.
Mientras que la hiptesis de investigacin seala que las diferencias entre las
muestras reflejan diferencias reales en la poblacin con respecto a la frecuencia
relativa de una caracterstica dada.
Ejemplo:
Hiptesis Nula: la frecuencia relativa de microempresas que llevan una contabilidad
formal y que iniciaron su actividad con un financiamiento externo, es la misma que
la frecuencia relativa de microempresas que llevan una contabilidad formal y que
iniciaron su actividad con ahorros personales.

Hiptesis Nula: la proporcin de microempresas con contabilidad formal y cuyo


inicio fue gracias a financiamiento externo, es la misma que la de microempresas
con contabilidad formal cuyo inicio fueron ahorros personales.

La informacin de la ENAMIN proporciona la siguiente informacin:


RECODE
p25
(1=2) (2 thru 5=1) INTO contab.
RECODE
p17

(5=1) (else=2) INTO financia .


value labels
contab 1 'Informal' 2 'Formal'/
financia 1 'Ahorro Personal' 2 'Prestamo' .
execute.
CROSSTABS
/TABLES=contab BY financia
/FORMAT= AVALUE TABLES
/CELLS= COUNT.

CONTAB * FINANCIA Crosstabulation


Count

CONTAB Informal
Formal
Total

FINANCIA
Ahorro
Personal
Prestamo
465
302
624
557
1089
859

Total
767
1181
1948

Una vez que tenemos las frecuencias esperadas y obtenidas, el valor de la


obtiene de la siguiente manera:
2

( f0 fe )2
fe

10

2 se

Las frecuencias esperadas se obtienen de la siguiente manera:

f1e,1

(Total _ Columa )(Total _ Re ngln)


Total _ Total

Para la frecuencia observada de informal-personal, 465, tenemos:

f1e,1

(1089)(767)
428.8
1948

Personal

Externo

Total

Informal
Formal

428.8
660.2

338.2
520.8

767
1181

Total

1089

859

1948

Noten que los totales de columnas y renglones no varan, lo que hicimos fue corregir
las proporciones de tal forma que no existiera diferencia entre tipo de
financiamiento. As
660.2
.61
1089

520.8
.61
859

Aplicando la formula:

( f0 fe )2
fe
11

465 428.8 2
428.8

302 338.2 2
338.2

624 660.2 2
660.2

557 520.8 2
520.8

3.1 3.9 2.0 2.5

2 11.5

Para interpretar este valor de

es necesario determinar los grados de libertad.

Para cuadros con un nmero determinado de renglones y columnas, los grados de


libertad se calculan:
df ( r 1)(c 1)

En esta caso (un cuadro de 2x2):


df (2 1)( 2 1) (1)(1) 1

Al observar la Tabla de Distribucin de 2 , encontramos que una 2 con 1 grado


de libertad y .05 de nivel de significancia es igual a 3.841. Este el valor que debe
excederse o igualar con el fin de rechazar la hiptesis nula. Como:
11.5 3.841

Debemos rechazar la hiptesis nula de que no hay diferencia entre microempresas


que iniciaron con ahorros personales y microempresas que requirieron
financiamiento externo en cuanto a llevar una contabilidad formal o no.
CROSSTABS
/TABLES=contab BY financia
/FORMAT= AVALUE TABLES
/STATISTIC=CHISQ

12

/CELLS= COUNT COLUMN.

CONTAB * FINANCIA Crosstabulation

CONTAB Informal
Formal
Total

Count
% within FINANCIA
Count
% within FINANCIA
Count
% within FINANCIA

FINANCIA
Ahorro
Personal
Prestamo
465
302
42.7%
35.2%
624
557
57.3%
64.8%
1089
859
100.0%
100.0%

Chi-Square Tests
Value
11.445b
11.131
11.489

df

Asymp. Sig. Exact Sig.


(2-sided)
(2-sided)
1
.001
1
.001
1
.001
.001

Exact Sig.
(1-sided)

Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
.000
Linear-by-Linear
11.439
1
.001
Association
N of Valid Cases
1948
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is
338.22.

13

Total
767
39.4%
1181
60.6%
1948
100.0%

También podría gustarte