Está en la página 1de 20

TECNOLÓGICO NACIONAL DE MÉXICO

INSTITUTO TECNOLÓGICO DE TIJUANA

INGENIERÍA INDUSTRIAL

ESTADÍSTICA INFERENCIAL II

UNIDAD I
Inferencias a partir de Dos Muestras.

PROFESOR
Ing. Juan Morales

ALUMNO: Sarabia Díaz Mario Israel


No CONTROL: 18211138
GRUPO: Y

30 de Enero del 2020.


UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS

INFERENCIA A PARTIR DE DOS PROPORCIONES

Objetivo

Someter a prueba una afirmación acerca de dos proporciones poblacionales, o


construir un intervalo de confianza de la diferencia entre dos proporciones
poblacionales.

Ejemplo
¿Las bolsas de aire salvan vidas? La siguiente tabla incluye los resultados de una
muestra aleatoria simple de ocupantes del asiento delantero involucrados en
choques de automóviles (¿según datos de “Who Wants Airbags?”, de Meyer y
Finney, Chance, vol. 18, núm. 2). Utilice un nivel de significancia de 0.05 para
someter a prueba la afirmación de que la tasa de mortalidad de los ocupantes es
menor en el caso de los automóviles equipados con bolsas de aire.

Tenemos la siguiente tabla

Dichos datos ya los tenemos capturado en minitab y nos plantea el problema que
ágamos una prueba con estas dos proporciones y sometamos la afirmación que la
tasa de mortalidad es menor con el uso de bolsas de aire, para ello nos vamos a
minitab.

Aquí tenemos

Prueba e IC para dos proporciones

Muestra X N Muestra p
1 41 11541 0.003553 0.35%
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
2 52 9853 0.005278 0.52%

Diferencia = p (1) - p (2)


Estimación de la diferencia: -0.00172503
Límite superior 95% de la diferencia: -0.000217916
Prueba para la diferencia = 0 vs. < 0: Z (estadístico)= -1.91 Valor p = 0.028

Aquí teneos el valor de P que es el más importante, en el ejercicio nos dice que el
valor de significancia es de 0.05 y el valor de P obtenido es de 0.028 que es
menor a 0.05 y cuando en la prueba P el valor de P es menor al nivel de
significancia rechazamos la hipótesis nula, por lo tanto tenemos las prueba
suficiente para rechazar la hipótesis nula y aceptar la hipótesis alternativa, por lo
tanto podemos concluir que en los automóviles equipados con bolsas de aire la
proporción de muerte de los ocupantes es menor con proporción con los
automóviles que no usan bolsas de aire.

Prueba exacta de Fisher: Valor p = 0.036

Ahora calcularemos el intervalo de confianza completo de una proporción a


otra

Prueba e IC para dos proporciones

Muestra X N Muestra p
1 41 11541 0.003553
2 52 9853 0.005278

Diferencia = p (1) - p (2)


Estimación de la diferencia: -0.00172503
IC de 95% para la diferencia: (-0.00352086, 0.0000708070)
Prueba para la diferencia = 0 vs. ≠ 0: Z = -1.91 Valor p = 0.056

Prueba exacta de Fisher: Valor p = 0.061

Como vemos todos los daros son iguales lo único que se modificó fueron los
valores de los intervalos de confianza y el valor de P porqué estamos planteando
la hipótesis alternativa. Pero lo que estábamos buscando son los intervalos de
confianza y como vemos el límite inferior queda hacia la izquierda de la estimación
de la diferencia por ser más negativo y el intervalo superior más a la derecha por
ser más positivo.

Como conclusión final al observar que el valor de P es menor que el valor de


significancia y es la más importante para determinar una conclusión y como es
menor rechazamos la hipótesis nula la cual plantea que las dos proporciones eran
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
iguales y aceptamos la hipótesis alterna que planteaba que la proporción 1 era
menor a la proporción 2.
Ejercicio

Moralidad y matrimonio Una encuesta del Pew Research Center preguntó a


sujetos elegidos al azar si coincidían con la afirmación de que “es moralmente
incorrecto que las personas casadas tengan un romance extramarital”. De las 386
mujeres encuestadas, 347 estuvieron de acuerdo con la afirmación. De los 359
hombres encuestados, 305 estuvieron de acuerdo con la afirmación. Utilice un
nivel de significancia de 0.05 para someter a prueba la afirmación de que el
porcentaje de mujeres que están de acuerdo difiere del porcentaje de hombres
que están de acuerdo. ¿Parece haber una diferencia en la forma en que los
hombres y las mujeres piensan acerca de este tema?

Tenemos la siguiente tabla

A Mujeres A Hombres
Numero de Afirmación de Acuerdo a Encuesta 347 305
Número Total de la Encuetados 386 359

Dichos datos ya los tenemos capturado en minitab y nos plantea el problema que
ágamos una prueba con estas dos proporciones y sometamos la afirmación que el
porcentaje de mujeres que están de acuerdo difiere del porcentaje de hombres
que están de acuerdo, para ello nos vamos a minitab.

Aquí tenemos

Prueba e IC para dos proporciones

Muestra X N Muestra p
1 347 386 0.898964
2 305 359 0.849582

Diferencia = p (1) - p (2)


Estimación de la diferencia: 0.0493816
IC de 95% para la diferencia: (0.00172287, 0.0970402)
Prueba para la diferencia = 0 vs. ≠ 0: Z (estadístico) = 2.04 Valor p = 0.042

Prueba exacta de Fisher: Valor p = 0.046


UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS

Aquí teneos el valor de P que es el más importante, en el ejercicio nos dice que el
valor de significancia es de 0.05 y el valor de P obtenido es de 0.042 que es
menor a 0.05 y cuando en la prueba P el valor de P es menor al nivel de
significancia rechazamos la hipótesis nula, por lo tanto tenemos las prueba
suficiente para rechazar la hipótesis nula y aceptar la hipótesis alternativa, por lo
tanto podemos concluir que si existe una diferencia en la forma en que los
hombres y las mujeres piensan que es moralmente incorrecto que las personas
casadas tengan un romance extramarital.

INFERENCIA ACERCA DE DOS MEDIA – MUESTRAS


INDEPENDIENTES

Definiciones

Dos muestras son independientes si los valores muéstrales seleccionados de


una población no están relacionados, pareados o asociados de alguna manera
con los valores muéstrales seleccionados de la otra población.

Dos muestras son dependientes si los valores muéstrales están pareados. [Es
decir, cada par de valores muéstrales consiste en dos medidas del mismo sujeto
(por ejemplo, datos de antes/después), o si cada par de valores muéstrales
consiste en datos asociados (por ejemplo, datos de esposo/esposa), donde la
asociación se basa en alguna relación inherente].

Ejemplo ¿Los hombres hablan tanto como las mujeres?

Un encabezado en USA Today afirmó que “los hombres hablan tanto como las
mujeres”. El encabezado se refería a un estudio del número de palabras que
hombres y mujeres pronuncian en un día. A continuación, se presentan los
resultados del estudio, (según datos de “Are Women Really More Talkative Than
Men?”, de Mehl, et al., Science, vol. 317, núm. 5834). Utilice un nivel de
significancia de 0.05 para someter a prueba la afirmación de que los hombres y las
mujeres pronuncian el mismo número de palabras en un día, considerando la
media. ¿Parece haber una diferencia? (es o que someteremos a prueba), y
Construya un intervalo de confianza para la diferencia.
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
Número de palabras pronunciadas en un día

Hombres Mujeres

n1 = 186 n2 = 210

X1 = 15668.5 X2 = 16215

S1 = 8632.5 S2 = 7301.2

Para resolver si hay diferencias entre dos muestras esto nos vamos a minitab,
aremos una prueba de hipótesis donde se compararan las dos medias, la hipótesis
nula Ho va a ser someter las dos medias para ver si existe alguna diferencia, la
hipótesis nula va a ser la media 1 va a ser igual a la media 2, la hipótesis
alternativa será lo contrario en nuestra hipótesis alternativa vamos a obtener la
diferencia mayor o menor, aremos la prueba P para ver si tenemos la prueba para
rechazar la hipótesis nula de la igualdad entre las dos medias y aceptaremos la
hipótesis alternativa que existe una diferencia entre las dos medias. Descrito esto
nos vamos a minitab.

Prueba T de dos muestras e IC

Error
estándar
de la
Muestra N Media Desv.Est. media
1 186 15669 8633 633
2 210 16215 7301 504

Diferencia = μ (1) - μ (2) (diferencia entre las dos medias muéstrales)


Estimación de la diferencia: -547
IC de 95% para la diferencia: (-2137, 1044)
Prueba T de diferencia = 0 (vs. ≠): Valor T = -0.68 Valor p = 0.500 GL = 364

Antes de ver el valor de P, tan solo con ver los valores del intervalo de confianza
de la diferencia de las dos muestras podemos ver el intervalo de confianza si lo
ponemos en una recta de un valor negativo a un valor positivo tenemos que pasar
por el cero y con esto tener un resultado de la igualdad en las dos medias, por
ende el intervalo de confianza nos está dando como conclusión que podemos
tener la igualdad o podemos tener diferencia, no tenemos la certeza.
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
Tenemos el valor del estadístico de T y el valor de P, recordemos que el valor de
significancia fue de 0.05 y para poder rechazar la hipótesis nula que dice que las
dos medias son iguales tenemos que tener un valor P menor a 0.05 y en este caso
el valor de P es de 0.5 por lo cual al ser mayor que el nivel de significancia no
tenemos la evidencia suficiente para rechazar la hipótesis nula de que las dos
medias son iguales por lo cual no podemos rechazar la igualdad de que los
hombres y mujeres hablan el mismo número de palabras en un día.

Recordando que el intervalo de confianza de 95% para la diferencia es de (-2137,


1044) y al incluir el cero porqué estamos pasando de un valor negativo a un
positivo es posible que exista la igualdad.

Como conclusión podemos decir que no existe la evidencia suficiente para decir
que existe una diferencia entre el número de palabras que pronuncia los hombres
y las mujeres.

Ejercicio Distancia de Frenado de Autos

Se obtiene una muestra aleatoria simple de 13 automóviles de cuatro cilindros, y


se miden sus distancias de frenado. La distancia media de frenado es de 137.5
pies y la desviación estándar es de 5.8 pies. Se obtiene una muestra aleatoria
simple de 12 automóviles de seis cilindros, y se observa que sus distancias de
frenado tienen una media de 136.3 pies y una desviación estándar de 9.7 pies.
Utilice un nivel de significancia de 0.05 para someter a prueba la afirmación de
que la distancia media de frenado de los automóviles de cuatro cilindros es mayor
que la distancia media de frenado de los automóviles de seis cilindros. Construya
un intervalo de confianza para la diferencia entre la distancia media de frenado de
los automóviles de cuatro cilindros y la distancia media de frenado de los
automóviles de seis cilindros.

DISTANCIAS DE FRENADO DE CARROS EN PIES


UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
Cuatro cilindros Seis cilindros

n1 = 13 n2 = 12

X1 = 137.5 X2 = 136.3

S1 = 5.8 S2 = 9.7

Dichos datos los capturaremos en minitab para someter a prueba la afirmación de


que la distancia media de frenado de los automóviles de cuatro cilindros es mayor
que la distancia media de frenado de los automóviles de seis cilindros, para ello
nos vamos a minitab.

Aquí tenemos

Prueba T de dos muestras e IC

Error
estándar
de la
Muestra N Media Desv.Est. media
1 13 137.50 5.80 1.6
2 12 136.30 9.70 2.8

Diferencia = μ (1) - μ (2) (media estándar)


Estimación de la diferencia: 1.20
Límite inferior 95% de la diferencia: -4.42
Prueba T de diferencia = 0 (vs. >): Valor T = 0.37 Valor p = 0.357 GL = 17

Aquí teneos el valor de P que es el más importante, en el ejercicio nos dice que el
valor de significancia es de 0.05 y el valor de P obtenido es de 0.357 que es mayor
a 0.05 y cuando en la prueba P el valor de P es mayor al nivel de significancia
no rechazamos la hipótesis nula, por lo tanto no tenemos las prueba suficiente
para rechazar la hipótesis nula y aceptar la hipótesis alternativa, por lo tanto
podemos concluir que la distancia media de frenado de los automóviles de cuatro
cilindros es mayor que la distancia media de frenado de los automóviles de seis
cilindros.

Prueba exacta de Fisher: Valor p = 0.036

Ahora calcularemos el intervalo de confianza completo para la diferencia


entre la distancia media de frenado
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS

Prueba T de dos muestras e IC

Error
estándar
de la
Muestra N Media Desv.Est. media
1 13 137.50 5.80 1.6
2 12 136.30 9.70 2.8

Diferencia = μ (1) - μ (2)


Estimación de la diferencia: 1.20
IC de 95% para la diferencia: (-5.61, 8.01)
Prueba T de diferencia = 0 (vs. ≠): Valor T = 0.37 Valor p = 0.715 GL = 17

Como vemos todos los daros son iguales lo único que se modificó fueron los
valores de los intervalos de confianza y el valor de P porqué estamos planteando
la hipótesis alternativa. Pero lo que estábamos buscando son los intervalos de
confianza de 95% y como vemos van de (-5,61 a 8.01) y al incluir el cero porqué
estamos pasando de un valor negativo a un positivo es posible que exista la
igualdad.

Como conclusión final al observar que el valor de P es mayor que el valor de


significancia y es la más importante para determinar una conclusión y como es
mayor no rechazamos la hipótesis nula la cual plantea que la distancia media de
frenado de los automóviles de cuatro cilindros es mayor que la distancia media de
frenado de los automóviles de seis cilindros.

INFERENCIA ACERCA DE DOS MEDIA – MUESTRAS


DEPENDIENTES

Definiciones
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
Dos muestras son independientes si los valores muéstrales seleccionados de
una población no están relacionados, pareados o asociados de alguna manera
con los valores muéstrales seleccionados de la otra población.

Dos muestras son dependientes si los valores muéstrales están pareados. [Es
decir, cada par de valores muéstrales consiste en dos medidas del mismo sujeto
(por ejemplo, datos de antes/después), o si cada par de valores muéstrales
consiste en datos asociados (por ejemplo, datos de esposo/esposa), donde la
asociación se basa en alguna relación inherente].

Ejemplo
Calificación con base en el consumo de combustible de automóviles

A continuación, se incluyen las calificaciones con base en el consumo de


combustible (en millas/gal) combinadas para la ciudad y para la carretera de
diferentes automóviles, otorgadas según el antiguo sistema de calificación y el
nuevo sistema (según datos de USA Today). El nuevo sistema de calificación se
implementó en respuesta a las quejas de que las calificaciones del antiguo
sistema eran demasiado elevadas. Utilice un nivel de significancia de 0.01 para
someter a prueba la afirmación de que las calificaciones del antiguo sistema eran
más elevadas que las del nuevo sistema. Y determine el intervalo de confianza
para la diferencia del sistema antiguo al sistema nuevo de calificación.

Los datos ya los tenemos ingresados en minitab donde están


las calificaciones de 20 diferentes automóviles a las cuales
se les hizo un análisis con el antiguo sistema de calificación y
con el nuevo sistema, siendo calificado cada unidad dos
veces
El problema nos pide utilice un nivel de significancia de 0.01 para someter a
prueba la afirmación de que las calificaciones del antiguo sistema eran más
elevadas que las del nuevo sistema, para ello nos vamos a minitab.

IC y Prueba T pareada: ANTIGUO SISTEMA DE CALIFICACION, NUEVO


SISTEMA DE CALIFICACION

T pareada para ANTIGUO SISTEMA DE CALIFICACION - NUEVO SISTEMA DE


CALIFICACION

Error
estándar
de la
N Media Desv.Est. media
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
ANTIGUO SISTEMA DE CALIF 20 22.70 5.37 1.20
NUEVO SISTEMA DE CALIFIC 20 20.35 4.72 1.05
Diferencia 20 2.350 0.745 0.167

Se sometió a prueba que la medo del antiguo sistema era igual al del nuevo
sistema, ese fue nuestra hipótesis nula que plantea que la diferencia es igual a
cero y la hipótesis alterna planteaba que la media del antiguo sistema es mayor al
del nuevo sistema. Nos pedía hacerlo a un nivel de significancia del 0.01 por lo
tanto nuestro nivel de confianza es del 99%.

Límite inferior 99% para la diferencia media: 1.927


Prueba t de diferencia media = 0 (vs. > 0): Valor T(ESTADISTICO) = 14.10
Valor p = 0.000

Puesto que el valor de P es menor al 0.01 valor de significancia rechazamos la


hipótesis nula y aceptamos la hipótesis alterna que dice que la media del antiguo
sistema es mayor al del nuevo sistema.

Y determine el intervalo de confianza para la diferencia del sistema antiguo


al sistema nuevo de calificación

T pareada para ANTIGUO SISTEMA DE CALIFICACION - NUEVO SISTEMA DE


CALIFICACION
Error
estándar
de la
N Media Desv.Est. media
ANTIGUO SISTEMA DE CALIF 20 22.70 5.37 1.20
NUEVO SISTEMA DE CALIFIC 20 20.35 4.72 1.05
Diferencia 20 2.350 0.745 0.167

IC de 99% para la diferencia media: (1.873, 2.827)


Prueba t de diferencia media = 0 (vs. ≠ 0): Valor T = 14.10 Valor p = 0.000

Como podemos observar todos los valores coinciden variando un poco el intervalo
ya que esta vez lo sometimos en igualdad.

Ejercicio Costos de reparación de automóviles

A continuación, se presentan los


costos (en dólares) de la reparación
de las partes frontal y trasera de
diferentes automóviles después de
los daños sufridos en choques
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
controlados a baja velocidad (según datos del Insurance Institute for Highway
Safety). Las marcas de los automóviles son Toyota, Mazda, Volvo, Saturn,
Subaru, Hyundai, Volkswagen y Nissan. Construya un intervalo de confianza del
95% para la media de las diferencias entre los costos de reparación de la parte
frontal y los costos de reparación de la parte trasera. ¿Hay alguna diferencia? . Y
determine el intervalo de confianza para la diferencia del sistema antigua al
sistema nuevo de calificación.

Los daros ya los tenemos ingresados en minitab donde están los 9 costos de
repacion a partes frontales y traseras, nos pide utilice un nivel de confianza del
95% para encontrar los límites y ver si hay alguna diferencia, para ello nos vamos
a minitab.

IC y Prueba T pareada: Costo Paerte Frontal, Costo Parte Trasera

T pareada para Costo Paerte Frontal - Costo Parte Trasera

Error
estándar
de la
N Media Desv.Est. media
Costo Paerte Frontal 9 2669 1461 487
Costo Parte Trasera 9 1830 1024 341
Diferencia 9 840 1935 645

IC de 95% para la diferencia media: (-648, 2327)


Prueba t de diferencia media = 0 (vs. ≠ 0): Valor T = 1.30 Valor p = 0.229
Estábamos buscando son los intervalos de confianza de 95% y como vemos van
de (-648 a 2327) y al incluir el cero porqué estamos pasando de un valor negativo
a un positivo es posible que exista la igualdad.

Como conclusión al ver que el intervalo de confianza incluye a $0, lo que sugiere
que la media de las diferencias podría ser 0, de manera que no parece existir una
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
diferencia significativa entre los costos de reparación de la parte frontal y de la
parte trasera.

COMPARACIÓN DE LA VARIACIÓN DE DOS MUESTRAS

Objetivo

Someter a prueba una afirmación acerca de dos desviaciones estándar o


varianzas poblacionales.

La prueba F (atribuida a Ronald Fisher) sirve para comparar dos varianzas


poblacionales (o desviaciones estándar). La prueba F requiere que ambas
poblaciones tengan distribuciones normales, y esta prueba es muy sensible a las
desviaciones que se alejan de la distribución normal.

Aquí utilizaremos la prueba F así como también utilizaremos el método de la


prueba P para someter a un aprueba de hipótesis la comparación de la variación
de dos muestras.

Ejemplo Conteos de Plaquetas

A continuación, se incluyen muestras de conteos de


plaquetas (número por mm3) de hombres y mujeres
elegidos al azar (según datos de la National Health
and Nutrición Examination Survey). Los conteos bajos
de plaquetas pueden provocar sangrado excesivo,
mientras que los conteos muy elevados aumentan el
riesgo de una trombosis. Utilice un nivel de
significancia de 0.05 para someter a prueba la
afirmación de que los hombres y las mujeres tienen
conteos de plaquetas con la misma desviación
estándar.

Los datos ya los tenemos ingresados en minitab, donde tenemos dos muestras las
muestras de 27 mujeres y 23 hombres cada una con el número de plaquetas por
mm3 y con ello se nos pide comparar las desviaciones estándar de ambas
muestras y revisar si esas desviaciones estándar son iguales, para ello nos
ayudamos con minitab.
Obtenemos todas las gráficas de la muestra 1 y la muestra 2
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
Gráfica de valores individuales de MUJERES, HOMBRES
500

450

400

350
Datos

300

250

200

150
MUJERES HOMBRES

Aquí tenemos una distribución de los datos de mujeres y los hombres, podemos
ver que la muestra de mujeres tiene una distribución más dispersa y el de los
hombres más pegados uno con otros, desde aquí podríamos identificar que las
mujeres tendrían que tener una desviación estándar mayor.
Histograma de MUJERES, HOMBRES
MUJERES
10.0

7.5

5.0

2.5
Frecuencia

0.0
HOMBRES
10.0

7.5

5.0

2.5

0.0
150 200 250 300 350 400 450

Aquí tenemos un histograma tanto de mujeres como de hombres vemos que el


dato de mujeres está más disperso y el de hombre está más concentrado.

Vamos a analizar la última gráfica que es la más importante y de igual


manera los datos de la prueba, empezaremos con los datos.
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS

Prueba e IC para dos varianzas: MUJERES, HOMBRES

Método

Hipótesis nula σ(MUJERES) / σ(HOMBRES) = 1


Hipótesis alterna σ(MUJERES) / σ(HOMBRES) ≠ 1
Nivel de significancia α = 0.05

La hipótesis nula plantea que la desviación estándar de los hombres y mujeres


son iguales por eso el resultado es 1
La hipótesis alterna plantea que la desviación estándar de los hombres y mujeres
son diferentes por eso su resultado será diferente a 1
El nivel de significancia es de 0.05 por lo tanto el nivel de confianza es del 95%

Se utilizó el método F. Este método es exacto sólo para datos normales.

Estadísticas

IC de 95% para
Variable N Desv.Est. Varianza Desv.Est.
MUJERES 27 75.993 5774.971 (59.846, 104.144)
HOMBRES 23 62.106 3857.127 (48.032, 87.901)

Relación de desviaciones estándar = 1.224


Relación de varianzas = 1.497

Intervalos de confianza de 95%

IC para IC para
relación de relación de
Método Desv.Est. varianza
F (0.805, 1.833) (0.648, 3.360)

Pruebas

Grados de libertad Estadística


Método GL1 GL2 de prueba Valor p
F 26 22 1.50 0.340

Lo más usado es el valor de P, el valor de P lo comparamos con el valor de nivel


de significancia que es de 0.05, si el valor de P es menor al valor de significancia
rechazamos la hipótesis nula y aceptamos la hipótesis alterna, sin embargo, el
valor de P es de 0.34 por lo cual no tenemos la evidencia suficiente para rechazar
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
la hipótesis nula de la igualdad por lo tanto es posible que las desviaciones
estándar sean iguales por sus intervalos.

Ahora analizaremos la gráfica para que quede mas claro


Prueba e IC para dos varianzas: MUJERES, HOMBRES
Relación = 1 vs. Relación ≠ 1

IC de 95% para σ(MUJERES) / σ(HOMBRES)


Prueba F
Valor p 0.340

0.8 1.0 1.2 1.4 1.6 1.8

ICs de chi-cuadrado de 95% para Desv.Est.

MUJERES

HOMBRES

50 60 70 80 90 100 110

Gráfica de caja de MUJERES, HOMBRES

MUJERES

HOMBRES

150 200 250 300 350 400 450

Aquí tenemos la razón que es lo que plantea la hipótesis nula que la felación va a
ser igual a 1 vs la razón diferente a 1 que es lo que plantea la hipótesis alterna.

Tenemos la referencia que es igual a 1 y el resultado que fue de 1.224 y el


intervalo de confianza que fue de (0.805, 1.833).

Tenemos el intervalo de la desviación estándar de las mujeres y la delos hombres


y como vemos tenemos puntos en común y es por eso que no tenemos la
evidencia suficiente para decir que son diferentes como ya lo avía menciona en la
comparación del valor de P.

Tenemos una gráfica donde vemos como están distribuidos, vemos que la
distribución de las mujeres es mayor y la de los hombres es más compacta .

Como conclusión final tenemos que no tenemos la evidencia suficiente para


rechazar la igualdad de que sus desviaciones estándar del grupo de hombres y
mujeres en el conteo de plaquetas por mm3 es igual o diferente.

Ejercicio Discriminación
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
Los Revenue Commissioners de Irlanda realizaron un
concurso para otorgar ascensos. A continuación, se
presentan las edades de los solicitantes con éxito y sin
éxito (según datos de “Debating the Use of Statistical
Evidence in Allegations of Age Discrimination” de Barry y
Boland, American Statistician, vol. 58, núm. 2). Utilice un
nivel de significancia de 0.05 para someter a prueba la
afirmación de que ambas muestras provienen de
poblaciones con la misma desviación estándar.

Los datos ya los tenemos ingresados en minitab, donde tenemos dos muestras los
solicitantes de 23 sin éxito y 30 con éxito cada una con las edades de los
solicitantes y con ello se nos pide someter a prueba la afirmación que ambas
muestras provienen de población con la misma deviación estándar, para ello nos
ayudamos con minitab.

Obtenemos todas las gráficas de la muestra 1 y la muestra 2

Gráfica de valores individuales de Solicitantes Sin Exito, Solicitantes Con Exito

60

55

50

45
Datos

40

35

30

25
Solicitantes Sin Exito Solicitantes Con Exito

Aquí tenemos una distribución de los datos de solicitantes sin éxito y con éxito,
podemos ver que la distribución en las muestras de solicitante con éxito y sin éxito
son muy similares, al analizar los datos podremos definir quien tendrían una
desviación estándar mayor.
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
Histograma de Solicitantes Sin Exito, Solicitantes Con Exito
Solicitantes Sin Exito
8

2
Frecuencia

0
Solicitantes Con Exito
12

0
25 30 35 40 45 50 55 60

Aquí tenemos un histograma tanto de solicitantes sin éxito y con éxito vemos que
el dato de solicitantes con éxito está más disperso y el de solicitantes sin éxito
está más concentrado.

Vamos a analizar la última gráfica que es la más importante y de igual


manera los datos de la prueba, empezaremos con los datos.

Prueba e IC para dos varianzas: Solicitantes Sin Éxito, Solicitantes Con Éxito

Método

Hipótesis nula σ(Solicitantes Sin Éxito) / σ(Solicitantes Con Éxito) = 1


Hipótesis alterna σ(Solicitantes Sin Éxito) / σ(Solicitantes Con Éxito) ≠ 1
Nivel de significancia α = 0.05

La hipótesis nula plantea que la desviación estándar de solicitantes sin éxito y con
éxito son iguales por eso el resultado es 1
La hipótesis alterna plantea que la desviación estándar de solicitantes sin éxito y
con éxito son diferentes por eso su resultado será diferente a 1
El nivel de significancia es de 0.05 por lo tanto el nivel de confianza es del 95%

Se utilizó el método F. Este método es exacto sólo para datos normales.

Estadísticas

IC de 95%
para
Variable N Desv.Est. Varianza Desv.Est.
Solicitantes Sin Éxito 23 7.220 52.134 (5.584, 10.219)
Solicitantes Con Éxito 30 5.884 34.616 (4.686, 7.909)
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
Relación de desviaciones estándar = 1.227
Relación de varianzas = 1.506

Intervalos de confianza de 95%

IC para IC para
relación de relación de
Método Desv.Est. varianza
F (0.831, 1.853) (0.690, 3.434)

Pruebas

Grados de libertad Estadística


Método GL1 GL2 de prueba Valor p
F 22 29 1.51 0.299

Lo más usado es el valor de P, el valor de P lo comparamos con el valor de nivel


de significancia que es de 0.05, si el valor de P es menor al valor de significancia
rechazamos la hipótesis nula y aceptamos la hipótesis alterna, sin embargo, el
valor de P es de 0.299 por lo cual no tenemos la evidencia suficiente para
rechazar la hipótesis nula de la igualdad por lo tanto es posible que las
desviaciones estándar sean iguales por sus intervalos.

Ahora analizaremos la gráfica para que quede más claro


Prueba e IC para dos varianzas: Solicitantes Sin Exito, Solicitantes Con Exito
Relación = 1 vs. Relación ≠ 1

IC de 95% para σ(Solicitantes Sin Exito) / σ(Solicitantes Con Exito)


Prueba F
Valor p 0.299

1.00 1.25 1.50 1.75 2.00

ICs de chi-cuadrado de 95% para Desv.Est.


Solicitantes Sin Exito

Solicitantes Con Exito

4 5 6 7 8 9 10

Gráfica de caja de Solicitantes Sin Exito, Solicitantes Con Exito

Solicitantes Sin Exito

Solicitantes Con Exito

30 40 50 60
UNIDAD I
INFERENCIAS A PARTIR DE DOS MUESTRAS
Aquí tenemos la razón que es lo que plantea la hipótesis nula que la relación va a
ser igual a 1 vs la razón diferente a 1 que es lo que plantea la hipótesis alterna.

Tenemos la referencia que es igual a 1 y el resultado que fue de 1.227 y el


intervalo de confianza que fue de (0.831, 1.853)

Tenemos el intervalo de la desviación estándar de solicitantes sin éxito y con éxito


y como vemos tenemos puntos en común y es por eso que no tenemos la
evidencia suficiente para decir que son diferentes como ya lo avía menciona en la
comparación del valor de P.

Tenemos una gráfica donde vemos como están distribuidos, vemos que la
distribución de solicitantes sin éxito es mayor y la de solicitantes con éxito es más
compacta.

Como conclusión final tenemos que no tenemos la evidencia suficiente para


rechazar la igualdad de que sus desviaciones estándar del grupo de solicitantes
sin éxito y con éxito es igual o diferente.

También podría gustarte