Está en la página 1de 7

ANALISIS DE DATOS CATEGORICOS

1. INTRODUCCION
Las pruebas de hipótesis de proporciones de categoría de variables cualitativas en
tablas de contingencia son las siguientes:
 Prueba de independencia de variable cualitativa
 Prueba de homogeneidad de muestra

Pruebe la bonda de ajuste entre las frecuencia observada en los intervalos y las
correspondiente frecuencia esperada de una distribución normal, con un nivel de
significación del 5%.

2. PRUEBA DE INDEPENDENCIA
La prueba de hipótesis de independencia implica dos variables categóricas y lo que
se prueba es la suposición de que las dos variables son estadísticamente
independiente.
Para cada frecuencia observada en una celda hay una frecuencia esperada que se
calcula a partir de la hipótesis especificada y que se supone que es verdadera.

HO: Las dos variables cualitativas son independiente.

Prueba estadística

ni. n. j o  eij 
2

X  
2 ij
eij  x 2 ((k  1)(c  1))
n eij

EJEMPLO 1
500 artículos se escogieron al azar de artículos producidos. Esto es independiente
según la calidad y según la línea de producción, como se indica en la tabla que sigue

línea de producción
Calidad 1 2 3
c1 40 90 70
c2 50 60 60
c3 60 50 20

A nivel de significación del 5% ¿se puede inferir que la calidad del producto es
independiente de la línea de producción?

3. PRUEBA DE HOMOGENEIDAD
Con la prueba de homogeneidad de muestra se busca determinar si dos o mas
muestra independiente proviene de una misma población.
Como en el método anterior, para esta prueba los datos muestrales se registran en
celda de tabla de contingencia de orden r * c.

HO: La muestra aleatoria proviene de una misma población.

Prueba estadística

ni. n. j o  eij 
2

X  
2 ij
eij  x 2 ((k  1)(c  1))
n eij

EJEMPLO 2

50
Un investigador estudia el nivel de efectividad de tres remedios para aliviar cierta
enfermedad. Para esto escogió tres muestra aleatoria de tamaño 50, 70 y 60 de
paciente de cierta enfermedad suministrando a la primera el remedio uno, al segundo
el remedio dos y al tercero el remedio tres y midiendo la efectividad de los remedios
en tres niveles: sin alivio, cierto alivio y alivio total. Los resultados del experimento se
dan en la tabla que sigue:

Remedios para la alegría


efectividad 1 2 3
sin alivo 10 20 15
cierto
alivio 30 20 20
alivio total 10 30 25

¿Puede usted inferir con probabilidad igual a 0.01 que los tres remedios son
igualmente efectivos?

PRACTICA DIRIGIDA

1. Una muestra de empleados de la universidad clasificada como docentes, no


docentes y de servicio, se les pidió que escogiera entre planes de seguro familiar
particular, en el cuadro que sigue se dan los resultados:

Plan de seguro
Clase A B C
docente 100 150 60
no
docente 40 70 20
servicios 20 40 10

Se puede afirmar que el plan de seguro depende de la clase de trabajo.

2. Un estudio de mercado de una empresa proporciona la tabla de datos que sigue,


donde la muestra de 800 consumidores de un producto especifico opina acerca de
las tres formas presentación y de la tres marcas que aparecen en el mercado:

Marca del producto


Presentación M1 M2 M3
P1 200 130 70
P2 60 60 80
P3 40 60 100

Existe relación entre la marca y la presentación del producto.

3. un grupo de alumnos realizan un trabajo acerca del consumo de un producto


específico que está a la venta en el mercado en cuatros marcas y tres

51
presentaciones diferentes. Las frecuencias observadas por los alumnos en una
muestra de 145 consumidores del producto se dan en la tabla adjunta:

Marca del producto


Presentación M1 M2 M3
P1 17 12 12
P2 20 28 17
P3 12 16 11

¿Cree usted que la población de consumidores escoge la marca del producto


independiente de la presentación?

4. El gerente de venta de una empresa afirma que las ventas de cuatros de sus
principales producto es homogénea entre sus clientes clasificados por tipos de
ocupación. Si su afirmación está sustentada entre otras cosas en la muestra
aleatoria de las ventas a mil clientes tabulada como sigue:

Producto
Ocupación 1 2 3 4
Profesionales 30 35 55 40
Comerciantes 155 50 125 80
Obreros 130 30 105 50
Ama de casa 35 15 20 45

Al nivel de significación del 5% ¿Qué opina usted de la afirmación del gerente?

5. Se clasifico en forma cruzada una muestra de 200 médicos en base a su


Especialidad y a la Zona de la comunidad en que estaban trabajando. los
resultados fueron los siguiente

zona de la especialidad
comunidad A B C
norte 20 18 29
sur 6 22 29
este 14 25 37

¿Proporciona estos datos la evidencia suficiente que indique una falta de


independencia entre los dos criterio de clasificación? Sea la significancia el 5%

6. Contrastar al nivel de 5% si hay alguna relación entre las Notas que


obtuvieron en bachillerato y el Salario que perciben los 150 empleados de
la universidad de lima

SALARIO NOTAS DEL BACHILLERATO


ALTA MEDIA BAJA
ALTO 18 17 5
MEDIO 26 38 16
BAJO 6 15 19

7. Una muestra de televidentes clasificados por clase social y por la sintonía diaria
de cuatro programa TV del mediodía se da en la siguiente tabla:

52
clase social
Programa Pobre Media baja Media Alta
1 190 280 500 280
2 250 300 350 150
3 160 250 180 120
4 100 150 80 80

Al nivel de significancia del 5% ¿Es homogéneo el ranking de los 4 programa en


las cuatro clases sociales?

8. Estamos interesados en estudiar la fiabilidad de cierto componente informático con


respecto al distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra
de 100 componentes de cada uno de los 3 distribuidores que nos sirven el producto
comprobando el número de defectuosos en cada lote. La siguiente tabla muestra el
número de defectuosos en para cada uno de los distribuidores

DISTRIBUIDOR DEFECTUOSO CORECTO


1 16 94
2 24 76
3 9 81

9. El gerente de recursos humanos de la empresa Goldex quiere conocer si el nivel de


ansiedad de sus trabajadores es independiente al nivel de producción de los mismos
para ello selecciona una muestra de 80 trabajadores. Los resultados se presentan en la
siguiente tabla. Use un nivel de significancia del 5%.

Nivel ansiedad Alto Medio Bajo


Normal 25 10 5
Leve 20 15 15
Moderado 10 13 20
Severo 5 14 30

10. La empresa Construye Ya S.A comercializa tres tipos de segmento A, B y C. En un


análisis de segmentación de mercado para los tres productos, el área de marketing
realiza una investigación para conocer si la preferencia de los tres tipos de segmento
son diferentes entre los consumidores de los sectores: Alto, Medio, Bajo. Para ello se
realiza una encuesta a 120 personas y se les pregunta sobre su preferencia acerca de
los tres tipos de segmento y los resultados se organizaron en la siguiente tabla. Utilice
un nivel de significancia del 5%.

Sector Detergente A Detergente B Detergente C


Alto 14 12 10
Medio 21 16 8
Bajo 15 12 12

11. Se quiere conocer la fiabilidad de cierto componente informático con relación al


distribuidor que nos lo suministra, para ello se toma una muestra de 300 componentes
de los tres distribuidores comprobando el número de defectuosos de cada distribuidor.

53
La siguiente tabla muestra el número de defectuosos para cada uno de los
distribuidores. Use un nivel de significancia del 5% y determine si la fiabilidad depende
del distribuidor.

Distribuidor Componentes Componentes


Defectuoso Correctos
Distribuidor 1 16 94
Distribuidor 2 24 76
Distribuidor 3 9 81

12. Se realiza una investigación para conocer la dependencia entre cierta enfermedad y la
adicción al tabaco. Para ello se selecciona una muestra de 100 individuos no
fumadores y 50 fumadores. Utilice un nivel de significancia del 5%

Padecen de la No padecen de la
enfermedad enfermedad

Fumadores 12 88
No fumadores 25 25

13. Star Perú desea determinar si existe alguna relación entre el número de vuelos que las
personas toman y sus ingresos anuales. ¿A qué conclusión se llega al nivel del 1% con
base en los datos para 100 viajeros en la tabla de contingencia?

14. La tienda por departamentos “Reyes” realizó un estudio para determinar si el estado
civil de sus clientes tienen relación con el volumen de compras que realizan. Los
resultados se presentan en la siguiente tabla:

54
Con un nivel de significación del 0,1 determine si existe relación entre las variables en
estudio.

15. Una empresa minera hizo un estudio para verificar si el lugar donde se realiza el
trabajo se relaciona con el grado de silicosis (enfermedad ocasionada al depositarse
partículas de sílice en los pulmones) de los trabajadores. Para lo cual se elige una
muestra aleatoria de 300 trabajadores y se clasifican en la tabla siguiente:

Probar con un nivel del 5% que el lugar en donde se realiza el trabajo afecta el grado
de silicosis del trabajador

16. La empresa embotelladora “Canteña” está evaluando la eficiencia de tres métodos que
utilizan para la profilaxis de los contenedores de vidrio. Después de aplicar una
encuesta a sus consumidores se desea determinar si la higiene es independiente del
método utilizado. Al nivel de significancia del 10%, ¿cuál es su conclusión con base en
los datos de la tabla?

17. El Ministerio de Producción está realizando un estudio sobre los lugares en donde se
puede encontrar y pescar los mejores ejemplares de trucha arcoiris, para ello ha
escogido la provincia de Yauyos y en una muestra de 400 truchas se recogieron los
datos correspondientes al tamaño y lugar en la que fueron encontradas.

55
Comprobar la hipótesis de que existe algún tipo de relación entre la longitud de la
trucha y el lugar donde fueron extraídas, con un nivel de significación de 0,05

LENGUAJE DE PROGRAMACION R

I. IMPLEMENTANDO Rcmdr
 Hacer clic en Packages
 Hacer clic en Usa (1)
 Hacer clic en Rcmdr
 Escribir library (Rcmdr)
 Seleccionar el archivo de dato
 Seleccionar estadístico
 Seleccionar tabla de contingencia

56