Está en la página 1de 64

UNIVERSIDAD PUBLICA DE EL ALTO

AREA DE INGENIERÍA DESARROLLO PRODUCTIVO


TECNOLOGICO
INGENIERÍA EN PRODUCCIÓN EMPRESARIAL

ESTADISTICA
MODELOS DE PROBABILIDAD
CONTINUA

PREPARADO:

NÉSTOR COCHI MACHACA


Distribución normal
P(0<z<1.55): La probabilidad de que el valor de z se
halla entre 0 a 1.55. gráficamente se podría representar
de la siguiente manera.

P(0<z<1,55)= 0,4394

0,4394

Por tanto:
P(z>1,55)= 0,5- 0,4394
P(z>1,55)= 0,0606
P(-1,34<z<1.45): La probabilidad de que el valor de z se
encuentre entre -1,34 a 1.45. gráficamente se podría
representar de la siguiente manera.
?
+

0,4099 0,42647

Por tanto:
P(-1,34<z<1,45)= 0,4099+0,42647= 0,83637

P(0,4<z<2,8): La probabilidad de que el valor de z este entre 0,4 y 2,8;


gráficamente podría representarse: ….
Aplicación de distribución estándar
Ej: Un profesor manifiesta que el promedio que los
estudiantes obtienen en su asignatura es de 3.9, con
una desviación típica de 0.35, cual es la probabilidad de
que uno de sus estudiantes obtenga:
a) una calificación superior a 4.4
b) Inferior a 3.2
c) Que gane la asignatura (mayor o igual a 3)?
Solución:
a) μ=3,9 σ=0,35 P(x>4,4)?
𝑋−μ
𝑍=
σ
𝑋 − μ 4,4 − 3,9
𝑍= = = 1,43  𝐴(0,42364)
σ 0,35
0,5-0,42364 = 0,0763*100= 7,63%
P(X>4,4)= 7,63%
b) Inferior a 3.2
Solución:
𝑋−μ
μ=3,9 σ=0,35 P(x<3,2)? 𝑍= σ

3,2 − 3,9
𝑍= = −2  𝐴(0,47725)
0,35
0,5-0,47725 = 0,0227*100= 2,27%
P(X<3,2)= 2,27%

c) Que gane la asignatura (mayor o igual a 3)


Solución:
μ=3,9 σ=0,35 P(x≥3)?
3,0 − 3,9
𝑍= = −2,57  𝐴(0,49492)
0,35
0,5 + 0,49492 = 0,99492*100= 99,49%
P(X ≥ 3)= 99,49%
Ej: El peso promedio de cada huevo de gallina, de todos
los producidos durante un mes en una granja, es de 50
gramos y la desviación estándar es de 8 gramos. Si se
supone que los pesos se distribuyen normalmente.

a) Determine el porcentaje de huevos que tendrán sus


pesos entre 55 y 65 gramos.
b) Determine el porcentaje de huevos con pesos entre 40
y 65 gramos.
c) Porcentaje de huevos con pesos menores a 45 gramos

Datos:
𝑋−μ
μ=50 g σ=8 g 𝑍= σ
a) Porcentaje de huevos que tendrán sus pesos entre 55
y 65 gramos.
𝑋−μ
𝑍= σ
Estandarizando para los valores de 55 y 65 g.:
55−50 65−50
𝑍1 = = 0,62 𝑍2 = = 1,87
8 8

El área se calcula por diferencia como se


Vio en un caso anterior.
P(0,62<z<1,87)= P(0<z<1,87) – P(0<z<0,62)
P(0,62<z<1,87)= 0,46926 – 0,23237
P(0,62<z<1,87)= 0,23689

El porcentaje de huevos producidos con pesos entre 55 y 65


gramos es de 23,69%.
b) Determine el porcentaje de huevos con pesos entre 40
y 65 gramos.
𝑋−μ
𝑍= σ
Estandarizando para los valores de 40 y 65 g.:
40−50 65−50
𝑍1 = = −1,25 𝑍2 = = 1,87
8 8

El área se calcula por diferencia como se


Vio en un caso anterior.
P(-1,25<z<1,87)= P(0<z<1,25) + P(0<z<1,87)
P(-1,25<z<1,87)= 0,39435 + 0,46926
P(-1,25<z<1,87)= 0,8637

El porcentaje de huevos producidos con pesos entre 40 y 65


gramos es de 86,37%.
c) Porcentaje de huevos con pesos menores a 45
gramos.
𝑋−μ
𝑍= σ
Estandarizando para los valores de 45 g.:
45−50
𝑍1 = = −0,62
8

El área se calcula por diferencia como se


Vio en un caso anterior.
P(z<-0,62)= 0,5 - P(z<-0,62)
P(z<-0,62)= 0,5 – 0,23237
P(z<-0,62)= 0,2676

El porcentaje de huevos con pesos menores a 45 gramos es


de 26,76%.
PRUEBA DE HIPOTESIS
Hipótesis estadística

Es un supuesto acerca de la distribución de probabilidad


de una o mas variables aleatorias. En la práctica, La
distribución de la población es a menudo implícitamente
supuesta, especificándose una hipótesis con el valor o
los valores del parámetro o los parámetros que la
definen.

Ej: El promedio poblacional de la altura de los peruanos


es de 1.70 m, esto es: μ=1.70

Ej: La proporción de unidades defectuosas por cierto


proceso es menor o igual a 8%. p≤ 0,08
Pruebas de hipótesis

Una hipótesis son declaraciones o suposiciones


sobre una población, formulada a partir de una
variable aleatoria «X», la cual se define como f(x),
que es conocida como la función de distribución.

Un prueba de hipótesis estadística H, es una regla de


decisión que permite rechazar o aceptar la hipótesis
H, en base a al información dada por la muestra
aleatoria extraída de una población en estudio. La
prueba de hipótesis se centra en alguna afirmación
sobre algún parámetro de la población.
Hipótesis Nula: Es la que se formula con la finalidad de
rechazarla y se denota por Ho. Se construye
artificialmente para que el investigador evalúe su
hipótesis de investigación. Plantea que no existe relación
entre los dos fenómenos.

Hipótesis Alterna: Simplemente señala la existencia de


un hecho o de un evento, o la relación entre dos o más
fenómenos. Se denota por Ha.

El rechazo de Ho implicará la aceptación la aceptación de


Ha.
Generalmente la hipótesis alternativa representa la
suposición que el investigador quiere probar, siendo Ho
formulada con el propósito expreso de ser rechazada.
Errores Tipo I y Tipo II

El procedimiento de decisión de aceptar o rechazar la


hipótesis nula esta sujeta a dos tipos de error. Estos
errores son debidos a fluctuaciones al azar en el
muestreo.
Tipo I: Es la probabilidad de rechazar la hipótesis nula,
cuando Ho es cierta. Esta probabilidad es comúnmente
denotada por la letra α, conocido también como el nivel de
significancia.
Tipo II: Es la probabilidad de aceptar la hipótesis nula cuando
Ho es falsa. Esta probabilidad es comúnmente denotada por
la letra β.
Nivel de significancia: Es la probabilidad máxima con la que
en el ensayo de una hipótesis se puede cometer un error del
tipo I, se denota por , se fija antes de la extracción de las
muestras.

Pasos de una prueba de Hipótesis


Una Prueba de hipótesis se realiza mediante un
procedimiento sistemático de cinco paso:
Paso 1. Plantear las hipótesis nula y alterna

Paso 2. Seleccionar un nivel de significancia

Paso 3. Identificar el valor estadístico de prueba

Paso 4. Formular una regla de decisión

Paso 5. Tomar una muestra, llegar a una decisión

No rechazar la Rechazar la hipótesis


hipótesis nula nula y aceptar la alterna
PASO 1: Plantear la hipótesis nula Ho y la hipótesis
alternativa Ha.

Hipótesis nula (Ho): es una afirmación que no se rechaza a


menos que los datos muestrales proporcionen evidencia de
que es falsa. Por lo general hay un "no" en la hipótesis nula
que indica que "no hay cambio". La hipótesis nula siempre
contiene un signo de igualdad (=) con respecto al valor
especificado del parámetro. μ1= μ2, μ= 15

Hipótesis alternativa (Ha): es cualquier hipótesis que difiera


de la hipótesis nula. Es una afirmación que se acepta si los
datos muestrales proporcionan evidencia de que la hipótesis
nula es falsa. Conocido también como la hipótesis de
investigación. El planteamiento de la hipótesis alternativa
nunca contiene un signo de igualdad con respecto al valor
especificado del parámetro. μ1≠ μ2; μ1< μ2; μ1> μ2
Paso 2. Seleccionar un nivel de significancia
El nivel de significancia es la Probabilidad de rechazar la hipótesis
nula cuando es verdadera. Se denota mediante la letra griega  ,
llamada también como error tipo I ó nivel de riesgo. Resumiendo, el
estadístico controla el error tipo I y generalmente se toma el valor
de  como 0.05 ó si se quiere ser mas riguroso 0.01.

> ≠ <

Cola derecha 2 colas Cola izquierda


La distribución de muestreo de la estadística de prueba
se divide en dos regiones, una región de rechazo
(conocida como región crítica) y una región de no
rechazo (aceptación). Si la estadística de prueba cae
dentro de la región de aceptación, no se puede rechazar
la hipótesis nula.

Paso 3. Identificar el valor estadístico de prueba


Valor determinado a partir de la información muestral,
que se utiliza para determinar si se rechaza la hipótesis
nula, existen muchos estadísticos de prueba para
nuestro caso utilizaremos los estadísticos z y t. La
elección de uno de estos depende de la cantidad de
muestras que se toman, si las muestras de la prueba son
iguales a 30 o mas se utiliza el estadístico z, en caso
contrario se utiliza el estadístico t.
Tipos de Prueba

a) Prueba bilateral o dos colas:


La hipótesis planteada se formula
con la igualdad

Ej: Ho : μ = 200 Ha : μ ≠ 200

b) Pruebas unilateral o una cola:


La hipótesis planteada se formula
(1 – α)
con ≥ o ≤

Ej: Ho : μ ≥ 200 ó Ho: μ ≤ 200

Ha : μ < 200 ó H1 : μ > 200 (1 – α)


Paso 4. Formular una regla de decisión
Las condiciones específicas establecidas es rechazar la
hipótesis nula y las condiciones en que no se rechaza la
hipótesis nula. La región de rechazo define la ubicación de
todos los valores que son tan grandes o tan pequeños, que
la probabilidad de que se presenten bajo la suposición de
que la hipótesis nula es verdadera, es muy remota.

Valor critico: Es el punto de división entre la región en la que se


rechaza la Ho y la región en la que no se rechaza la Ho.
Paso 5. Tomar una decisión
En este último paso de la prueba de hipótesis, se calcula el
estadístico de prueba, se compara con el valor crítico y se
toma la decisión de rechazar o no la hipótesis nula. Tenga
presente que en una prueba de hipótesis solo se puede
tomar una de dos decisiones: aceptar o rechazar la
hipótesis nula.
Debe subrayarse que siempre existe la posibilidad del error
tipo I y el error de tipo II.
Regiones criticas al 5% y 1% para pruebas de 2 colas.

2,5% 95% 2,5% 0,5% 99% 0,5%

0 0
Z=1,96 Z=1,96 Z=1,96 Z=2,58
Rechazo Ho Acepta Ho Rechazo Ho Rechazo Ho Acepta Ho Rechazo Ho
Prueba de Hipótesis de la Media con Varianza
Conocida
Regiones criticas al 5% para pruebas de una cola (puede ser
derecha o izquierda)
Cola derecha Cola izquierda

95% 0,5% 95%

Z=1,64 Z=1,64
Acepta Ho Rechazo Ho Rechazo Ho Acepta Ho

Regiones criticas al 1% para pruebas de una cola (puede ser derecha o


izquierda) Cola derecha Cola izquierda

99% 1% 99%

Z=2,33 Z=2,33
Acepta Ho Rechazo Ho Rechazo Ho Acepta Ho
Sea X1,…. Xn una muestra aleatoria tomada de una
población N(μ ,σ2), donde σ2 es conocida.
X−μ0
Estadístico de prueba: 𝑍𝑐 =
σ/√𝑛
Reglas de decisión:
Ho: μ=μ0
Si │Zc│>Zα/2 Se rechaza Ho
Ha: μ≠μ0

Ho: μ≤μ0
Si Zc >Zα Se rechaza Ho
Ha: μ>μ0

Ho: μ≥μ0
Si Zc <-Zα Se rechaza Ho
Ha: μ<μ0
Ej: La estatura media o promedio de los estudiantes de
estadística es de 1.60 m?

μ=1,60 μ≠1,60 Ho: μ=1,60

Ej: El porcentaje de personas atacadas por la pandemia


en nuestra ciudad es no mayor del 10%.

p≤0,10 p>0,10 Ho: p ≤0,10

Ej: La duración media de una muestra de 100 tubos


fluorescentes producidos por una compañía resulta ser de
1570 horas, con una desviación típica de 120 horas. Si μ es la
duración media de todos los tubos producidos por la compañía,
comprobar la hipótesis μ=1600 horas contra la hipótesis
alterna μ≠1600 con un nivel de significación de 0,05.
Ej: La duración media de una muestra de 100 tubos
fluorescentes producidos por una compañía resulta ser de
1570 horas, con una desviación típica de 120 horas. Si μ es la
duración media de todos los tubos producidos por la compañía,
comprobar la hipótesis μ=1600 horas contra la hipótesis
alterna μ≠1600 con un nivel de significación de 0,05.

Datos:
μ = 1600 horas
X= 1570 horas 1) Planteo de la Hipótesis
σ = 120 horas
n= 100 Ho: μ = 1600 horas
α = 0,05 Ha: μ ≠ 1600 horas

2,5% 95%
2) Determinación de la región
2,5% critica o valor critico, por el
signo, la prueba es de 2
Z=1,96 Z=1,96
Rechazo Ho Acepta Ho Rechazo Ho
colas al nivel del 5%.
3) Calculamos el estadístico de prueba.

X−μ0 1570−1600
𝑍𝑐 = = 120/√100 = −2,5
σ/√𝑛
4) Toma de decisión.

2,5% 95%
2,5%

Z=1,96 Z=1,96
Zc= -2,5
Rechazo Ho Acepta Ho Rechazo Ho

Como Zc (-2,5) cae en la zona de rechazo de Ho; No se acepta la


hipótesis nula Ho.

5) Conclusión:
La duración media de los tubos fluorescentes es diferente de 1600
horas, a un nivel de significancia del 5%.
Ej: Teóricamente, una maquina automática despachadora de
refrescos envasa 225 ml por unidad. Una muestra aleatoria
de 36 refrescos, que tienen un contenido promedio de 220
ml, con una desviación estándar de 15 ml. Pruebe la
hipótesis del promedio teórico igual a 225 ml en
contraposición a la hipótesis alterna de que es menor a 225
ml en el nivel de significación del 5%.
Datos:
μ = 225 ml
X= 220 ml 1) Planteo de la Hipótesis
σ = 15 ml
n= 36 Ho: μ = 225 ml
α = 0,05 Ha: μ < 225 ml
95%
5% 2) Determinación de la región
critica o valor critico, por el
Z=1,64 signo, la prueba es de cola
Rechazo Ho Acepta Ho izquierda al nivel del 5%.
3) Calculamos el estadístico de prueba.

X−μ0 220−225
𝑍𝑐 = = 15/√36 = −2,00
σ/√𝑛
4) Toma de decisión.

0,95
0,05

Z=1,64
Zc= -2,0
Rechazo Ho Acepta Ho

Como Zc (-2,0) cae en la zona de rechazo de Ho; Se rechaza la


hipótesis nula Ho.

5) Conclusión:
Se puede afirmar que el contenido promedio es menor de 225 ml, a
un nivel de significancia del 5%.
Distribuciones especiales
a) Distribución “t” de Student
En muchas ocasiones no se conoce 𝜎 y el número de
observaciones en Ia muestra es menor de 30. En estos
casos, se puede utilizar Ia desviación estándar de Ia
muestra S como una estimación de 𝜎, pero no es posible
usar Ia distribución Z como estadístico de prueba. El
estadístico de prueba adecuado es Ia distribución t.
Se dice que una muestra es grande, si el número de
unidades o elementos es mayor a 30 (n>30) y es pequeña
si es menor o igual a treinta (n≤30).

En el caso de que se desconozca la desviación típica


poblacional, se le podrá reemplazar por la desviación
típica muestral, siempre que la muestra sea grande.
Cuando n>30 (muestra grande), la desviación típica se
simboliza por S y se considera como un buen estimador de la
desviación típica poblacional, debido a que existe una mayor
probabilidad de que los valores extremos que toma la variable,
queden incluidos en el cálculo de la varianza en la muestra, tal
como ocurre al obtener la varianza poblacional.

Siendo: S = σ, la fórmula para calcular S será


Si n ≤ 30 (muestra pequeña), la desviación típica se simboliza
por S cuando no se ha efectuado ninguna corrección. Se
considera que Ŝ, por lo general, es menor que σ, debido a la
poca posibilidad de que se incluyan valores extremos de la
variable poblacional en la muestra. Por lo tanto, se hace
necesario efectuar algunas correcciones en su cálculo, con el
fin de convertirla en un buen estimador de la desviación típica
poblacional.
También se puede expresar como

Esta nueva variable no es más normalmente distribuida,


teniendo su propia distribución, llamado t de student.
Cuando n aumenta f(t) se va haciendo cada vez más
apuntada, tendiendo a la curva normal tipificada N(0,1),
cuando n→∞. En general, la curva normal es una buena
aproximación de la distribución t cuando n ≥ 30.
La distribución t de Student es sumamente importante
para la estimación y el contraste de hipótesis sobre la
media de una población. Si se tiene una población
que sigue una distribución normal con media μ y
desviación típica σ (N(μ,σ)), y se extrae una muestra
aleatoria de tamaño n sobre la que se calcula una
media X y una desviación típica S, entonces la
variable aleatoria es dada por
X−µ
𝑡𝑐 = 𝑆
𝑛
Grados de libertad
El número de grados de libertad (υ) de un estadístico,
generalmente se escribe υ, y se define como el número
(N) de observaciones independientes en la muestra
(tamaño de la muestra) menos el numero k de parámetro
de la población, que debe ser estimado a partir de
observaciones muestrales, υ =N-k.
Propiedades de las distribuciones t
1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, está más dispersa que Ia curva normal
estándar.
3. A medida que k aumenta, Ia dispersión de Ia curva t
correspondiente disminuye.
4. A medida que k-> ∞, la secuencia de curvas t se aproxima a
Ia curva normal estándar.
Ej: Una muestra de 16 observaciones tiene una media de
28 y una desviación estándar de 3. Utilizando el nivel de
significancia del 5%. Existe razón para rechazar la
hipótesis de que la media de la población es de 30?.

Solución:
μ = 30
X= 28 1) Planteo de la Hipótesis
σ=3
n= 16 Ho: μ = 30
α = 0,05 Ha: μ ≠ 30
2) Determinación de la región
2,5% 95% critica o valor critico.
2,5%
t tab= n-1 =15 grados de libertad (gl).
Z=-2,131 Z=2,131
α = 0,05 2 colas
Rechazo Ho Acepta Ho Rechazo Ho
t tab= 2,131
3) Calculamos el estadístico de prueba.

X−μ 30−28
𝑡𝑐 = = 3/√16 = −2,66
s/√𝑛
4) Toma de decisión.

2,5% 95%
2,5%

Z=-2,131 Z=2,131
tc= -2,66 tc= 2,66
Rechazo Ho Acepta Ho Rechazo Ho

Como tc (-2,66) cae en la zona de rechazo de Ho; Se rechaza la


hipótesis nula Ho.

5) Conclusión:
Existe suficiente evidencia para afirmar que la media de la
población (μ) es diferente de 30, a un nivel de significancia del
5%.
Ej: Con 10 automóviles de una misma fabrica y con iguales
características, se trato de probar la calidad de dos tipos de
gasolina, con la gasolina tipo A, 5 de los vehículos escogidos
al azar rindieron 30 km/galón en promedio y una desviación
estándar de 2,6 km/galón. Con la gasolina de tipo B, los
otros 5 vehículos rindieron 27 km/galón y un desvío estándar
de 3,4 km/galón. Es posible señalar que la gasolina de tipo A
es mejor que la de tipo B con 5% de riesgo?.

Solución:
Gasolina tipo A: n1= 5; μA= 30 km/galón; S1=2,6 km/galón
Gasolina tipo B: n2= 5; μB= 27 km/galón; S2=3,4 km/galón

1) Planteo de la hipótesis
Ho: μA= μB ambas gasolinas tienen similares rendimientos
Ha: μA> μB la gasolina tipo A es mejor que la de tipo B
2) Determinación de la región critica o valor critico.
t tab= n1+n2-2= 5+5-2= 8 gl
α = 0,05 1 cola (derecha)
t tab= 1,860
95%
5%

1,860
3) Calculo del estadístico de Acepta Ho Rechazo Ho
prueba.
1,56

Calculamos la varianza agrupada


𝑛1 − 1 𝑆12 + 𝑛2 − 1 𝑆22 5 − 1 2,62 + 5 − 1 3,42
𝑆𝑐 2 = = = 9,16
𝑛1 + 𝑛2 − 2 5+5−2
Este valor reemplazamos en tc.

Estadístico de prueba X1 −X2 30−27


para diferencia entre 𝑡𝑐 = 𝑆𝑐12 +𝑆𝑐22
= 9,16+9,16
= 1,56
medias. 𝑛1+𝑛2 5+5
4) Toma de decisión:

Como tc cae en la zona de aceptación de Ho, se acepta la Ho

5) Conclusión:

No existe evidencia para afirmar que la gasolina de tipo A es mejor


que la gasolina de tipo B a un riesgo del 5%.
b) Distribución Chi cuadrado (X2)

La prueba de Chi cuadrado es de gran utilidad para el


estudio de la variación de las poblaciones, además ofrece
otros tipos de pruebas, como las pruebas de bondad de
ajuste, ajuste de distribución de frecuencias por muestreo
y tablas de contingencias.

La distribución de Chi cuadrado aparece con mucha


frecuencia en la estadística aplicada, ya que los
llamados “test” del cociente de máxima seguridad que
se utilizan en las pruebas de hipótesis estadística
tienen todas distribuciones asintóticas chi cuadrado.
Si se tiene una población normal con media μ y varianza
σ2 , se obtienen muestras de tamaño n, con su media X,
estandarizado las muestras:

Es decir, que para las n observaciones de la muestra, se


tendrán n valores respectivos de Zi:

Elevando cada uno de estos valores al cuadrado


𝑋1 − μ 2 𝑋2 − μ 2 𝑋𝑛 − μ 2
( ) ,( ) ,….,( )
σ σ σ
Sumando se tiene:
(𝑋1 − μ)2 (𝑋2 − μ)2 (𝑋𝑛 − μ)2
2
+ 2
+ ⋯+
σ σ σ2
Cada uno de estos, es una variable diferente, se
representa por:
𝑍12 + 𝑍22 + ⋯ + 𝑍𝑛2

Cada valor de 𝒁𝟐𝟏 es una variable diferente, ya que cada


una de estas variables tiene su distribución que se
simboliza por X2 , expresado por:
2
2
σ ( 𝑋1 − μ)
෍ 𝑍𝑖 =
σ2
Cada una de las muestras tiene un numero de n
observaciones y tiene una X2 , en función del numero de
observaciones.
𝑍𝑖2 = X2 = 𝑗𝑖 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜
Para cada tamaño de muestra existe una diferente
distribución de X2.
Desde que n, el tamaño de la muestra, es una variable,
significa que para cada tamaño de muestra existe una
diferente distribución X2, encontrándose por consiguiente
X2 representada por una familia de curvas.

Distribución de Ji cuadrado para gl = 1,4 y 10

Por definición, Ji – cuadrado, es la suma de las fracciones que tienen


por numerador el cuadrado de las diferencias entre las frecuencias
reales u observadas y las frecuencias esperadas o teóricas y por
denominador la frecuencia esperada.
Manejo de la tabla
Ej: Supongamos un riesgo del 5% (o un nivel de confianza del 95%),
α=0.05, y grados de libertad ν=10. ¿Cuál es el valor de χ20.05,10? Se debe
buscar la intersección y el resultado es 18.307. Éste es el valor crítico para
rechazar la hipótesis alternativa.
Ej: Buscar el valor de X2 5 gl y α= 0,05 para la cola
izquierda.
Como la tabla da valores de 95% ó también 0,95 de área
probabilidad de la cola derecha,
entonces para encontrar el valor que
deje por debajo del 5% de área. Por
5%
lo que debemos buscar en la tabla ,
el valor con 5 gl y 1 – α (1-0,05):

X2 con 5 gl y 0,95 es = 1,14548

Ej: Buscar el valor de X2 5 gl y α= 0,05 para dos colas.


De acá adelante hay
0,95+0,025=0,975 de área
Debemos buscar 2 valores tabulares:
Hay 0,95 de área
Uno en la cola derecha para α= 0,025;
en la tabla este valor que se busca
directamente es X2= 12,83250 y 0,025 0,95
0,025
corresponde al valor de X2 para la cola
derecha.
El otro valor lo buscamos primero,
restando de 1 el valor de α/2.

1 – α= 1 – 0,025= 0,975
0,95
0,025 0,025
Seguidamente buscamos en la tabla el
valor de X2 para 5 gl y para una
probabilidad de 0,975. 0,83121 12,83250
X2= 0,83121 es el valor de la cola
izquierda.

Prueba de frecuencias observadas

Formula de prueba

Donde:
Oi= frecuencias observadas
Ei= frecuencias esperadas
Ej: En un experimento Mendeliano con arvejas se obtuvo
13 flores rojas, 42 rosadas y 25 blancas. De acuerdo a la
teoría deben tenerse una proporción de 1 roja, 2 rosadas
y 1 blanca. Se ajustan los resultados a la teoría del 1%?
Datos:
N= 13+42+25= 80
Relación esperada 1:2:1
O también 1/4: 2/4: ¼
Antes de resolver es necesario realizar ciertos cálculos
La frecuencia esperada de flores rojas es una proporción
de 1/4, es decir, que de las 80 plantas totales 1/4 de estas
deberían ser rojas:
Flores rojas esperadas: 1/4 *80= 20
La frecuencia esperada de flores rosadas es en una
proporción de 2/4 o 1/2, es decir, que de las 80 plantas
totales 1/2 de estas deberían ser rosadas:
Flores rosadas esperadas: 1/2*80 = 40

La frecuencia esperada de flores blancas es una


proporción de 1/4, es decir, que de las 80 plantas totales
1/4 de estas deberían ser blancas:
Flores rojas esperadas: 1/4 *80= 20

El siguiente cuadro resume los k eventos posibles y sus


frecuencias observadas y esperadas
Evento Observadas Esperadas
F. Rojas 13 20
F. Rosadas 42 40
F. Blancas 25 20
Total 80 80

Solución:
1) Planteamiento de la hipótesis
Ho: Los resultados se ajustan a la proporción 1: 2: 1
Ha: Los resultados no se ajustan a la proporción 1: 2: 1

2. Establecer la región o valor critico

Ubicamos el valor tabular de X2 con k – 1 de gl y α =0,01


k= 3 numero de eventos, en este caso son 3 (roja, rosada y
blanca), para la tabla:
X2tab con k – 1= 2 gl y α =0,01 = X2tab = 9,21034
99%
1%
3. Calculo del estadístico
de prueba 9,210
Z. Aceptación Ho Z. Rechazo Ho

(13−20)2 (42−40)2 (25−20)2


X2c = + + 20 =3,8
20 40
4. Toma de decisión
X2c cae en la zona de aceptación de la Ho; como X2c < X2tab,
no podemos rechazar la Ho.

5. Conclusión
Los resultados se ajustan a la proporción teórica 1: 2: 1
Ej: Se desea estudiar la dependencia entre la practica de
algún deporte y la depresión, para lo cual se selecciono
una muestra aleatoria simple de 100 jóvenes con los
siguientes resultados observados:
Sin depresión Con depresión TOTAL
Deportista 38 9 47
No deportista 31 22 53
TOTAL 69 31 100
Determinar si existe independencia entre practicar deporte
y el estado de animo, con una significancia de 5%.
1) Planteamiento de la hipótesis
Ho: La practica del deporte y el estado de animo son
independientes.
Ha: La practica del deporte y el estado de animo son
dependientes.
2. Establecer la región o valor critico

Ubicamos el valor tabular de X2 con k – 1 de gl y α =0,05


k= 2 numero de eventos, en este caso son 2:
Deportista y no deportista: 2-1= 1
Sin depresión y con depresión: 2-1= 1
gl = 1
X2tab con (n-1)(m-1)= (2-1)(2-1)= 1 gl y α =0,05= X2tab = 3,84146

95%
5%

3,841
Z. Aceptación Ho Z. Rechazo Ho
Sin depresión Con depresión TOTAL
Deportista E 32,43 O 38 E 14,57 O9 47
No deportista E 36,57 O 31 E 16,43 O 22 53
TOTAL 69 31 100
Previamente calculamos los valores esperados:

(69*47)/100= 32,43 (31*47)/100= 14,57


(69*53)/100= 36,57 (31*53)/100= 16,43

3. Calculo del estadístico de prueba

(38−32,43)2 (31−36,57)2 (9−14,57)2 (22−16,43)2


X2c = + + 14,57 + 16,43 =5,82
32,43 36,57
4. Toma de decisión: Se rechaza la hipótesis Ho

5. Conclusión: El practicar deporte y el estado de animo


son dependientes a un 5% de significancia.

3,841
Acepta Ho Rechazo Ho
5,82
c) Distribución F de Fisher – Snedecor
Una prueba de F es una relación entre dos varianzas para
determinar si dos estimaciones de varianzas
independientes pueden ser admitidas como estimaciones
de una misma varianza.
Es una distribución de probabilidad de gran aplicación en
la inferencia estadística, fundamentalmente en la
contrastación de la igualdad de varianzas de dos
poblaciones normales, y fundamentalmente en el análisis
de la varianza.
Técnica que permite detectar la existencia o inexistencia
de diferencias significativas entre muestras diferentes y
aquellos casos en los que se quiere investigar la
relevancia de un factor en el desarrollo y naturaleza de
una característica.
La variable aleatoria F es no negativa, y la distribución
tiene un sesgo hacia la derecha. Dominio de x es de 0 a
infinito.

Es una distribución de probabilidad continua que aparece


frecuentemente en el análisis de varianza.

La curva es asimétrica, donde la función f es una función


continua respecto al intervalo de 0 a +∞.

Esta distribución depende de dos parámetros, v1 y v2,


que representan los grados de libertad del numerador y
denominador, respectivamente. La función de densidad de
probabilidad de la distribución F esta dada por:
Donde v1 y v2 son números enteros positivos.
También se puede definir como la distribución de
probabilidad de conocer dos varianzas provenientes de
dos poblaciones diferentes. Por medio de esta distribución
es posible determinar la probabilidad de ocurrencia de una
razón especifica con δ1=n-1 y δ2=m-1 grados de libertad en
muestras de tamaño n1 y n2. Es decir:
𝑆𝑥2 /𝛿1
𝐹= 2
𝑆𝑦 /𝛿2

Luego: (𝑋 21 + 𝑋 2 2 + ⋯ 𝑋 2 𝛿 )/𝛿1
𝐹=
(𝑌 21 + 𝑌 2 2 + ⋯ 𝑌 2 𝛿 )/𝛿2

𝑛 − 1 𝑆 2 𝑥 /𝛿1
Reemplazando: 𝐹=
𝑚 − 1 𝑆 2 𝑦 /𝛿2
Como 𝛿1 𝑦 𝛿2 son grados de libertad que se pueden elegir, para cancelar (n-
1) y (m-1) hacemos coincidir:
𝛿1 = 𝑛 − 1 𝛿2 = (𝑚 − 1)

Así tendríamos: 𝛿1 𝛿2
𝑆2𝑥
𝐹 = 2 ~ 𝐹(𝑛 − 1, 𝑚 − 1)
𝑆 𝑦
Es decir, La variable F es conocer dos varianzas de
muestras provenientes de dos poblaciones diferentes,
con una distribución con parámetros (n-1) y (m-1).

CARACTERÍSTICAS:
❖ X e Y deben ser independientes.
❖ La distribución de la variable es asimétrica, pero su asimetría
disminuye cuando aumentan los grados de libertad del numerador y
denominador. Cada curva F. tiene forma asimétrica y es sesgado hacia
la derecha (es positivo al sesgo).
❖ La distribución F, utiliza doble (n-1) = gL. Que para el numerador se le
llama N y para el denominador se le llama D.
❖ Su cubertura depende de su grado de libertad.
Manejo de tablas

Ej: Localizar los valores de F, utilizando la tabla respectiva,


dependiendo del nivel de significación.

a) r1= 12 b) r1= 14 c) r1= 40


r2= 16 r2= 20 r2= 80
∝ = 0.05 ∝ = 0.01 ∝ = 0.10

Solución:
a) F = 2.42 b) F = 3.13 c) F = 1.40
Ej: Dos procesos de envasar mermelada, ensayados por una
compañía, rinden el mismo peso medio. Sin embargo, el
primer proceso es más rápido y la compañía está dispuesta a
usarlo, a menos que la varianza sea muy grande comparada
con el segundo proceso, a un nivel de significación del 5 por
ciento.
Del primer proceso, se tiene una muestra de 25 frascos y una
desviación estándar de 30 gramos; y del segundo proceso, se
tiene una muestra de 20 frascos y una desviación estándar de
22 gramos. A que conclusión puede llegarse de estos
resultados?.
Solución:
Datos:
Dos compañías de envasar mermelada
n1 = 25 frascos n2 = 20 frascos
σ21 = 30 g σ22 = 22 g
∝ = 0.05
Planteando las Hipótesis:
Ho: σ21 = σ22
Ha: σ21 > σ22

Se supone que las muestras se extraen al azar de dos


poblaciones normalmente distribuidas con varianzas idénticas.

El nivel de significación es ∝ = 0.05.

Para la prueba se usara F como estadístico, con grado de


libertad (r = n – 1) de 24 y 19 y una sola cola.
La región critica de Ft = 2.11
para ∝ = 0.05.

El cálculo del estadístico


es como sigue:

Fc = σ21/ σ22
= 302/ 222 2,11
= 900/ 484 Acepta Ho Rechazo Ho
= 1.86

Siendo que Fc es menor que 2.11, se acepta la hipótesis


nula y la compañía puede usar el primer proceso de
envasado.

También podría gustarte