Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El Modelo Matemático.
Ejemplo
Distribución Normal Estándar
El Intervalo de Confianza
Teorema Central del Límite
Tamaño de Muestra
Distribución de “t”. Muestras Pequeñas.
Contraste de promedios Manuel Pontigo Alvarado
Marte
1 2004.
La Prueba de F.
ISBN 9968 9634
2
Introducción
Los estudiosos de las ciencias biológicas se dieron cuenta que la distribución
de las frecuencias de medidas de individuos de las poblaciones naturales
presentaban una forma acampanada al dibujarla en un plano.
Por otro lado, los matemáticos buscaban modelos que pudieran emular las
distribuciones que estas poblaciones presentaban.
Con el tiempo, se descubrió El Promedio Aritmético de un conjunto de datos.
Casi inmediatamente se descubrió que la suma de las desviaciones de las
medidas de las observaciones con respecto al promedio era cero.
n n
d x
i 1
i
i 1
i x 0
Media 811,94
Error típico 15,12
Mediana 823
Moda 762
Desviación estándar 240,51
Varianza de la muestra 57.846,23
Curtosis 0,09
Coeficiente de asimetría -0,13
Rango 1.340
Mínimo 112
Máximo 1.452
Suma 205.421
Cuenta 253
7
Interpretación
El interés es saber si la distribución de los pesos de las truchas se
puede considerar normal para aprovechar las ventajas analíticas de
esta distribución.
La media con 811,94 y la mediana con 823 gramos indican que podría
tenerse una distribución equilibrada;
El coeficiente de curtosis de 0,09 se encuentra entre los límites
permitidos a una normal de 250 datos entre –0,45 y 0,52 indicando,
por el signo positivo un muy ligero alargamiento;
El valor absoluto del coeficiente de Asimetría de –0,13 es inferior a
0,251 de las tablas para 250 permitido a una normal. El signo nos
indica una cola izquierda ligeramente mayor.
La moda, con datos individuales es de poca utilidad.
8
Preparando el Histograma: el intervalo de clase
f i xi x
Frecuencias 3 x x
Clase xi Absolutas
f i xi 2 x x
f i i f i i
s
s
1 116 0 0,00 0,00 0,0000 0,0000
2 216 7 1.512,00 2.613.821,81 -95,6014 228,5177
3 316 6 1.896,00 1.567.138,06 -47,9385 95,8361
4 416 7 2.912,00 1.182.833,66 -29,1029 46,7967
5 516 13 6.708,00 1.257.916,39 -23,4210 28,4988
6 616 30 18.480,00 1.336.480,81 -16,8843 13,9402
7 716 35 25.060,00 431.757,25 -2,8703 1,2470
8 816 46 37.536,00 5.634,21 -0,0037 0,0002
9 916 38 34.808,00 300.543,67 1,5998 0,5565
10 1.016 31 31.496,00 1.106.563,76 12,5136 9,2482
11 1.116 17 18.972,00 1.419.196,83 24,5436 27,7397
12 1.216 9 10.944,00 1.361.418,55 31,6932 48,2177
13 1.316 9 11.844,00 2.151.497,60 62,9636 120,4218
14 1.416 5 7.080,00 1.734.209,25 61,1317 140,8312
15 1.516 0 0,00 0,00 0,0000 0,0000
Número de Observaciones 253 Suma de Cuadrados 16.469.011,86
Suma Total 209.248 Varianza 65.353,22
Promedio 827,07 Desvío Estándar 255,64
Mediana 879,04 Coeficiente de asimetría -0,0855
Moda 873,89 Curtosis 0,0600
15
Diferencias con Estadísticos Directos
Pocas son las diferencias que se tienen entre los cálculos de datos
individuales con datos agrupados.
Media: 811,84 y 814,83. Mediana: 823 y 824,96. Moda 762 y 841,26.
El más significante se obtiene con la moda. Al ser el valor más
frecuente, fue el que individualmente más se repite, pero no refleja
con veracidad la verdadera tendencia modal, importante en muchos
análisis de poblaciones.
La moda se acomoda al lado de la cola más corta de la distribución
con la mediana en medio de ambos estadísticos de posición. Es
evidente que los estadísticos individuales no presentan la secuencia
indicada.
El coeficiente de asimetría muestra valores negativos en ambos casos
-0,13 y -0,07 indicador de un sesgo a la izquierda, esto es, una cola
izquierda ligeramente más larga.
La prueba de Bondad de Ajuste: la distribución de 16
aproximación.
La Prueba Completa.
0
19
La probabilidad de la prueba:
7 ,1662
P ( 152 1 ) f ( x;14)dx 0,9281
0
Frecuencias
puede aproximar con mucha 30,0
Y la varianza:
2
15
x x
fi i
s
z
2 i 1
n 1
2 2 2
57 814,83 167 814,83 1.597 843,83
0 0 3 0 ... 0 0
243,11 243,11 243,11 252 1
253 1 252
22
La Distribución Normal Estándar
Con los datos estandarizados se descubrió La Distribución Normal
Estándar, con probabilidades idénticas a La Distribución Normal, pero
con la ventaja de usar Números Puros basados en un sistema numérico
definido por Una Desviación Estándar, cuya valor está definido por:
2
1 x μ
1 i
f ( z;0;1) e 2 σ
2π
Y cuyas probabilidades acumulativas se encuentran resolviendo:
2
1 x μ
1 z i
F ( z;0;1) e
2 σ
dz
2π
2
1 2 827
1 -2,4886
F ( z S 2 ;0;1) dz DISTR.NORM.ESTAND(-2,4886) 0,00641
2 243,11
e
2π
40,0
pocas diferencias con respecto 35,0
Probabilidades
a la normal, hace que el sesgo 30,0
20,0
5,0
izquierda con respecto a la 0,0
curva ideal representada en -3,17 -2,71 -2,26 -1,81 -1,36 -0,90 -0,45 0,00 0,45 0,90 1,36 1,81 2,26 2,71 3,17
Pr xo z s μ xo z s 1 α
En donde:
El promedio de la población que se quiere estimar se indica como ;
El límite inferior para lo establece el promedio de la muestra
menos z veces la desviación estándar;
El límite superior para lo establece el promedio de la muestra más
z veces la desviación estándar:
La probabilidad que determina a z se conoce como o nivel de
confianza.
28
Interpretación del Intervalo de Confianza
0,60
0,50
0,40
No tenemos que calcular
0,30
Área = 9,77%
Promedio = 0.815
mucho para ubicar el
0,20
z=-1,295
promedio pues este parte la
0,10
0,00
distribución de los datos en
0,00 0,11 0,22 0,33 0,44 0,55 0,66 0,77 0,88 0,99 1,10 1,21 1,32 1,43 1,54
500 gr
dos partes de igual
Kilogramos de trucha
probabilidad (50%)
0,70
0,60 Promedio = 0,815
0,50
0,40 Peso Límite
Desviación Estándar y
0,30
0,20
z = 0,8416 1,019
sumado al promedio indicó
0,10
0,00
un peso de 1,019 Kg separa
al 20% de Truchas más
0 0,11 0,22 0,33 0,44 0,55 0,66 0,77 0,88 0,99 1,1 1,21 1,32 1,43 1,54
Kilogramos de trucha
pesadas.
El conteo indicó 44 pesos iguales o superiores a 1,019 Kg., un 17,39%
de los pesos. Nuevamente la proporción observada difiere de la
esperada, debido a las diferencias con la normal teórica. No obstante,
estos valores se espera que sean más exactos que otros estimados
mediante otros métodos, aun cuando con los datos del ejemplo
resulten más precisos.
33
Trucha Comercial en %. Intervalo Cerrado.
Probabilidades
significa que entre más se 0,60
Comercial de 750 a
1.000 gr.
Kilogramos de trucha
No alcanzan el peso mínimo.
50 100
xˆ S 19,76% Sobrepasan el máximo comercial.
253
Posiblemente, el impacto psicológico de pescar truchas grandes sea tanto
más importante que vender al mínimo. Por tanto, es imperativo que la
empresa encuentre la manera de reducir el porcentaje de peces de bajo peso.
2.35 ¿Qué sucede si la distribución de los 35
datos no es Normal.
s s
Pr xi z X xi z 1
n n
280 peces?
Para el límite inferior:
s 278,9574
Pr X z Pr 866,73 - 1,96 834,06 2,5%
n 280
Para el límite superior:
s 278,9574
Pr X z Pr 866,73 1,96 899,41 2,5%
n 280
en la Estimación
Puesto que el margen comercial del peso de la trucha de 750 a
1.000 gramos es amplio, no se requiere mucha precisión. Un
5% alrededor del promedio sería suficiente. Por tanto,
tomando los estadísticos de la poza 3:
d x 0,05 909,01 0.05 45,45
Y la cantidad de peces que se deben muestrear serían:
n
z s 1,96 75.299,4423
2 2
2
140
d2 45,452
Dada la naturaleza de las instalaciones sería lógico pensar
que deberían tomarse al azar el peso de 14 muestras de pesos
de las truchas capturadas en cada una de las pozas o pescar
14 truchas en cada poza.
La Elección Aleatoria de la Muestra 49
es Absolutamente Indispensable.
muestra.
Probabilidad.
La otra manera que la HE ofrece un valor para la prueba, y sea quizá
más ilustrativa es la probabilidad que señala el estadístico en la
función de densidad con respecto a la zona de aceptación de la
hipótesis, esto es, entre los límites de confianza:
26 1
1,0189 2
2
F (1,0189;26) Y0 1 dt 0,3177
0
26
S i
2
Valoración de Ho:
Contraste Media 1 Media 2 Diferencia Estadístico Probabilidad Criterio
Poza 2 vs Poza 4 977,79 965,29 12,50 0,1144 0,9091 NS
Poza 2 vs Poza 5 977,79 900,57 77,21 0,7066 0,4811 NS
Poza 2 vs Poza 1 977,79 884,57 93,21 0,8531 0,3952 NS
Poza 2 vs Poza 3 977,79 872,36 105,43 0,9648 0,3364 NS
Poza 2 vs Poza 8 977,79 861,21 116,57 1,0668 0,2880 NS
Poza 2 vs Poza 7 977,79 806,57 171,21 1,5669 0,1196 NS
Poza 2 vs Poza 10 977,79 767,71 210,07 1,9225 0,0567 NS
Poza 2 vs Poza 9 977,79 741,07 236,71 2,1663 0,0321 Significativo
Poza 2 vs Poza 6 977,79 677,14 300,64 2,7513 0,0068 Significativo
Poza 4 vs Poza 5 965,29 900,57 64,71 0,5922 0,5547 NS
Poza 4 vs Poza 1 965,29 884,57 80,71 0,7387 0,4614 NS
Poza 4 vs Poza 3 965,29 872,36 92,93 0,8504 0,3966 NS
Poza 4 vs Poza 8 965,29 861,21 104,07 0,9524 0,3427 NS
Poza 4 vs Poza 7 965,29 806,57 158,71 1,4525 0,1488 NS
Poza 4 vs Poza 10 965,29 767,71 197,57 1,8081 0,0729 NS
Poza 4 vs Poza 9 965,29 741,07 224,21 2,0519 0,0422 Significativo
Poza 4 vs Poza 6 965,29 677,14 288,14 2,6370 0,0094 Significativo
Poza 5 vs Poza 1 900,57 884,57 16,00 0,1464 0,8838 NS
Poza 5 vs Poza 3 900,57 872,36 28,21 0,2582 0,7967 NS
Poza 5 vs Poza 8 900,57 861,21 39,36 0,3602 0,7193 NS
Poza 5 vs Poza 7 900,57 806,57 94,00 0,8602 0,3912 NS
Poza 5 vs Poza 10 900,57 767,71 132,86 1,2158 0,2262 NS
Poza 5 vs Poza 9 900,57 741,07 159,50 1,4597 0,1468 NS
Poza 5 vs Poza 6 900,57 677,14 223,43 2,0447 0,0429 Significativo
Poza 1 vs Poza 3 884,57 872,36 12,21 0,1118 0,9112 NS
Poza 1 vs Poza 8 884,57 861,21 23,36 0,2138 0,8311 NS
Poza 1 vs Poza 7 884,57 806,57 78,00 0,7138 0,4766 NS
Poza 1 vs Poza 10 884,57 767,71 116,86 1,0694 0,2869 NS
Poza 1 vs Poza 9 884,57 741,07 143,50 1,3132 0,1914 NS
Poza 1 vs Poza 6 884,57 677,14 207,43 1,8983 0,0599 NS
:::: :::: :::: :::: :::: :::: ::::
Resultado de la Prueba 60
Letras iguales
Poza Promedio no hay diferencias
A la derecha se ofrece el cuadro
Poza 2 977,79 a
de promedios arreglado desde el Poza 4 965,29 a
mayor al menor. Poza 5 900,57 ab
Poza 1 884,57 abc
Los promedios con letras iguales Poza 3 872,36 abc
no mostraron diferencias Poza 8 861,21 abc
significativas. Las diferencias de Poza 7 806,57 abc
Poza 10 767,71 abc
la poza 2 a la 10 deben Poza 9 741,07 bc
considerarse debidas al azar. Poza 6 677,14 c
El las pozas 2, 4 y 5 hay factores que ayudan a que las truchas pesen más
que las de las posas 9 y 6; o, en las pozas 9 y 6 hay factores que deprimen
el peso de las truchas.
La consecuencia es: ¡Se encontró un motivo para profundizar en el
análisis del peso diferencial de las truchas según la poza en que se
alimentan hasta su edad comercial!.
Dos Distribuciones más de la Familia de la Normal 61
Cuando se comparan dos o más poblaciones se crea una nueva varianza que
corresponde a los promedios de estas poblaciones definida por:
b
n x x
2