Está en la página 1de 13

PRUEBAS DE HIPÓTESIS DE PROPORCIONES Y CHI CUADRADA

(VARIABLES NO-MÉTRICAS)

Como investigadores en muchas ocasiones estamos interesados en un fenómeno


cuyo comportamiento es expresado en porcentajes. Por ejemplo, podemos estar
interesados en probar si la proporción de potenciales electores que planean votar
por el candidato del PRI es estadísticamente distinta de la proporción que declaró
preferir el candidato del PAN.

I. Prueba de Hipótesis de Proporciones para una Sola Muestra.

Una encuesta realizada por Bancomer a 35 clientes indicó que un poco más del 74
por ciento tenían un ingreso familiar de más de $200,000 al año. Si esto es cierto,
el banco desarrollará un paquete especial de servicios para este grupo. La
administración quiere determinar si el porcentaje verdadero es mayor del 60 por
ciento antes de desarrollar e introducir este nuevo paquete de servicios. Los
resultados mostraron que 74.29 por ciento de los clientes encuestados reportaron
ingresos de $200,000 o más al año.

El procedimiento para la prueba de hipótesis de proporciones es el siguiente:

1. Especifica la hipótesis nula y alternativa.

Hipótesis Nula: H 0  P  .60


Hipótesis Alternativa: H a  P  .60 ,

donde P = la proporción de clientes con ingresos familiares anuales de $200,000


o más.

2. Específica el nivel de significación,  , permitido. Para una   .05 , el valor


de tabla de Z para una prueba de una sola cola es igual a 1.64.

3. Calcula el error estándar de la proporción específicada en la hipótesis nula.

p (1  p )
sp 
n

donde:
p = proporción especificada en la hipótesis nula.

n = tamaño de la muestra.

Por consiguiente:

0.60(1  0.60)
sp   .0828
35

4. Calcula la estadística de prueba:

( proporción _ observada)  ( proporción _ H 0 )


z
sp

0.7429  0.60
z  1.73
0.0828

5. La hipótesis nula se rechaza porque el valor de la Z calculada es mayor que


el valor crítico Z . El banco puede concluir con un 95 por ciento de confianza
(1    .95) que más de un 60 por ciento de sus clientes tienen ingresos
familiares de $200,000 o más. La administración puede introducir el nuevo
paquete de servicios orientado a este grupo.

El presidente del PRI en 1988, basado en su experiencia, sostiene que un 95% de


los votos para las elecciones presidenciales han sido a favor de su partido. Los
partidos de oposición levantaron una muestra de1,100 electores y encontraron
que un 87% de ellos votaría por el PRI. El presidente del PRI quiere probar la
hipótesis, con un nivel de significación de 0.05, que el 95% de los votos son para
su partido.

2
Hipótesis Nula: H o : p  0.95
Hipótesis Alternativa: H a : p  0.95
Tamaño de muestra: n=1,100
Nivel de Significación = 0.05.

El primer paso es calcular el error estándar de la proporción utilizando el valor


hipotético del porcentaje que históricamente vota por el PRI:

p (1  p ) 0.95 * 0.05
SE p    0.0066
n 1100

Ahora sólo es necesario construir el intervalo de confianza:

po  1.96 * SE p

0.95  1.96 * 0.0066  0.937  0.963

La proporción de .87 de votos por el PRI en la encuesta no cae en la región de


aceptación, por lo tanto el presidente del PRI debe de “preocuparse” por que la
tendencia entre los votantes es a favorecer menos al PRI.

SEXO DEL PATRON

Valid Cumulative
Frequency Percent Percent Percent
Valid Hombre 1634 83.9 83.9 83.9
Mujer 314 16.1 16.1 100.0
Total 1948 100.0 100.0

3
Probemos la hipótesis de que el porcentaje de microempresas cuyos dueños son
hombres captado por la ENAMIN es distinto de 88 por ciento.

Hipótesis Nula: H 0  P  0.88


Hipótesis Alternativa: H 0  P  0.88

0.88(1  0.88)
sp   .0074
1948

0.839  0.88
z  5.54
0.0074

La hipótesis nula se rechaza porque el valor de la Z calculada es menor que el valor


crítico Z de 1.96. Podemos concluir con un 95 por ciento de confianza (1    .95)
que la proporción captada por la ENAMIN es estadísticamente distinta de 0.88.

II. Prueba de Hipótesis para Diferencias entre Dos Proporciones (Muestras


Independientes).

Algunas veces estamos interesados en analizar la diferencia entre las proporciones


de poblaciones de grupos con distintas características. Por ejemplo, pensemos que
la administración de las tiendas Oxxo cree, sobre la base de una investigación,
que el porcentaje de hombres que visitan sus tiendas 9 o más veces al mes (clientes
frecuentes) es mayor que el porcentaje de mujeres que hacen lo mismo. Las
especificaciones requeridas y el procedimiento para probar esta hipótesis es la
siguiente:

4
1. Las hipótesis nula y alternativa son las siguientes:

H o  PH  PM  0 ,
la proporción de hombres que reportan 9 o más visitas por
mes es la misma o menor que la proporción de mujeres que hacen lo mismo.

H a  PH  PM  0 ,
la proporción de hombres que reportan 9 o más visitas por
mes es mayor a la proporción de mujeres que hacen lo mismo.

La información proporcionada es:

n H  45 nM  71

PH  .58 PM  .42

PH  PM  .58  .42  .16

2. Especifica el nivel de significación de   .05 . El valor crítico para la prueba


de una sola cola es de 1.64.

3. Estima el error estándar de la diferencia de las dos proporciones:

 1 1 
s p hm  P (1  P )  
 nH nM 

donde:

n H PH  nM PM
P
n H  nM

PH = proporción muestra de hombres (H)


PM = proporción muestra de mujeres (M)
NH = tamaño de muestra hombres
NM = tamaño de muestra mujeres

5
Por lo tanto:

45(.58)  71(.42)
P  0.48
45  71

y
 1 1 
s p hm  .48(1  .48)    0.10
 45 71 

4. Calcula de prueba estadística:

(diferencia_ entre _ proporciones _ observadas)  (diferencia_ entre _ proporciones _ Ho )


Z
s ph  m

(.58  .42)  (0)


Z  1.60
.10

La hipótesis nula es aceptada porque el valor de la Z calculada es menor que el


valor crítico Z. La administración no puede concluir con un 95 por ciento de
confianza que la proporción de hombres que visita 9 o más veces los Oxxo es mayor
que la proporción de mujeres.

SPSS no cuenta con procedimientos para hacer pruebas de hipótesis de


proporciones. Probemos si el porcentaje de hombres dueños de microempresas es
estadísticamente diferente del porcentaje de mujeres.

6
1634(83.9)  314(16.1)
P  72.97
1634  314

y
 1 1 
s p hm  ..73(1  ..73)    0.0274
 1634 314 

(.839  .161)  (0)


Z  24.74
.0274

La hipótesis nula es rechazada porque el valor de la Z calculada es mayor que el


valor crítico Z. Podemos concluir que el porcentaje de hombres dueños de
microempresas es estadísticamente superior al porcentaje de mujeres propietarias de
microempresas.

7
III. Chi-Cuadrada

La mayoría de la información que se trabaja en las ciencias sociales o


administrativas es de carácter no-métrico nominal. Por lo mismo, muchas de las
técnicas multivariadas más populares, como la regresión lineal de mínimos
cuadrados, presentan serias limitaciones analíticas.

¿Cómo analizar información nominal o categórica?

2 es una prueba estadística no paramétrica para diferencias entre dos o más


muestras donde frecuencias esperadas son comparadas en relación con frecuencias
obtenidas.

2 se utiliza para hacer comparaciones entre frecuencias y no entre valores medios.

Prueba No Paramétrica: procedimiento estadístico que no adopta ningún supuesto


acerca de cómo se distribuye la característica bajo estudio en la población, y que
sólo requiere datos nominales u ordinales.

Estas medidas son importantes porque la mayoría de la información en la


investigación social y administrativa es de carácter nominal u ordinal, y porque no
siempre estamos seguros que la característica que deseamos estudiar se distribuye
normalmente en la población.

La prueba de significación  2 se refiere esencialmente a la distinción entre


frecuencias esperadas y frecuencias obtenidas.

Las frecuencias esperadas f e se refieren a los términos de la hipótesis nula, según


la cual la frecuencia relativa (o proporción) se supone es la misma entre los dos
grupos.

Por ejemplo, si se espera que un 50% de los negocios que llevan una contabilidad
formal hayan iniciados sus actividades con ahorros personales, entonces también
esperamos un 50% de aquellos que empezaron con financiamiento externo.

8
Las frecuencias obtenidas f o se refieren a los resultados obtenidos en el estudio y
que, por consiguiente, pueden variar o no de un grupo a otro.

Sólo si la diferencia entre las frecuencias observadas y obtenidas es suficientemente


grande, se rechaza la hipótesis nula, y se concluye que existe una diferencia real en
la población.

Como resultado, la hipótesis nula para la  2 señala que las poblaciones o grupos
no difieren con respecto a la frecuencia de ocurrencia de una característica dada.
Mientras que la hipótesis de investigación señala que las diferencias entre las
muestras reflejan diferencias reales en la población con respecto a la frecuencia
relativa de una característica dada.

Ejemplo:

Hipótesis Nula: la frecuencia relativa de microempresas que llevan una contabilidad


formal y que iniciaron su actividad con un financiamiento externo, es la misma que
la frecuencia relativa de microempresas que llevan una contabilidad formal y que
iniciaron su actividad con ahorros personales.

Hipótesis Nula: la proporción de microempresas con contabilidad formal y cuyo


inicio fue gracias a financiamiento externo, es la misma que la de microempresas
con contabilidad formal cuyo inicio fueron ahorros personales.

La información de la ENAMIN proporciona la siguiente información:

RECODE
  p25
  (1=2) (2 thru 5=1)  INTO  contab.

RECODE
  p17

9
  (5=1)  (else=2)  INTO  financia .

value labels 
 contab 1 'Informal' 2 'Formal'/
 financia 1 'Ahorro Personal' 2 'Prestamo' .
execute.

CROSSTABS
  /TABLES=contab  BY financia
  /FORMAT= AVALUE TABLES
  /CELLS= COUNT.

CONTAB * FINANCIA Crosstabulation

Count
FINANCIA
Ahorro
Personal Prestamo Total
CONTAB Informal 465 302 767
Formal 624 557 1181
Total 1089 859 1948

Una vez que tenemos las frecuencias esperadas y obtenidas, el valor de la  2 se


obtiene de la siguiente manera:

( f0  fe )2
2  
fe

Las frecuencias esperadas se obtienen de la siguiente manera:

10
(Total _ Columa)(Total _ Re nglón)
f1e,1 
Total _ Total

Para la frecuencia observada de informal-personal, 465, tenemos:

(1089)(767)
f1e,1   428.8
1948

Personal Externo Total

Informal 428.8 338.2 767


Formal 660.2 520.8 1181

Total 1089 859 1948

Noten que los totales de columnas y renglones no varían, lo que hicimos fue corregir
las proporciones de tal forma que no existiera diferencia entre tipo de
financiamiento. Así

660.2 520.8
 .61 y  .61
1089 859

Aplicando la formula:

( f0  fe )2
2  
fe

11
2 
 465  428.8 2   302  338.2 2   624  660.2 2 
 557  520.8 2  3.1  3.9  2.0  2.5
428.8 338.2 660.2 520.8

 2  11 .5

Para interpretar este valor de 2 es necesario determinar los grados de libertad.

Para cuadros con un número determinado de renglones y columnas, los grados de


libertad se calculan:

df  ( r  1)(c  1)

En esta caso (un cuadro de 2x2):

df  ( 2  1)( 2  1)  (1)(1)  1

Al observar la Tabla de Distribución de  2 , encontramos que una  2 con 1 grado


de libertad y .05 de nivel de significancia es igual a 3.841. Este el valor que debe
excederse o igualar con el fin de rechazar la hipótesis nula. Como:

11 .5  3.841

Debemos rechazar la hipótesis nula de que no hay diferencia entre microempresas


que iniciaron con ahorros personales y microempresas que requirieron
financiamiento externo en cuanto a llevar una contabilidad formal o no.

CROSSTABS
  /TABLES=contab  BY financia
  /FORMAT= AVALUE TABLES
  /STATISTIC=CHISQ
  /CELLS= COUNT COLUMN.

12
CONTAB * FINANCIA Crosstabulation

FINANCIA
Ahorro
Personal Prestamo Total
CONTAB Informal Count 465 302 767
% within FINANCIA 42.7% 35.2% 39.4%
Formal Count 624 557 1181
% within FINANCIA 57.3% 64.8% 60.6%
Total Count 1089 859 1948
% within FINANCIA 100.0% 100.0% 100.0%

Chi-Square Tests

Asymp. Sig. Exact Sig. Exact Sig.


Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 11.445b 1 .001
Continuity Correctiona 11.131 1 .001
Likelihood Ratio 11.489 1 .001
Fisher's Exact Test .001 .000
Linear-by-Linear
11.439 1 .001
Association
N of Valid Cases 1948
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is
338.22.

13

También podría gustarte