Documentos de Académico
Documentos de Profesional
Documentos de Cultura
A Punt Es Dee Stadi Stica
A Punt Es Dee Stadi Stica
Curso de Estadística
Dirigido a:
De Institutos Profesionales
Edición revisada
Autor:
ÍNDICE
Capítulo 1
1.1 Introducción al concepto de Estadística
1.2 Gráficos
Capítulo 2
2.1 Distribuciones de frecuencias, Histogramas
2.2 Distribución de frecuencias acumuladas y ojivas.
2.3 Ejercicios de aplicación
Capítulo 3
3 Promedios
3.1 Media Aritmética
3.2 Media Aritmética Ponderada
3.3 Propiedades de la Media Aritmética
3.4 Cálculo de la Media Aritmética para datos agrupados
3.5 Ejercicios de aplicación.
3.6 La Mediana
3.7 La Moda
3.8 Relación empírica entre la media aritmética, la mediana y la
moda
Capítulo 4
4 Medidas de la dispersión de una distribución de datos
4.1 Dispersión o variación
4.2 Rango o Intervalo
4.3 La Desviación Típica
4.4 Desarrollo de tres fórmula para el cálculo de la Desviación
Típica
4.5 Propiedades de la desviación Típica
4.6 Varianza
4.7 Desviación Media
4.8 Ejercicios en clase.
4.9 Ejercicios de Aplicación
Capítulo 5
5 CuantilosCuantilos
5.1 Definición
5.2 Medidores de Tendencia Central
5.3 Medidores de la Dispersión
5.4 Procedimiento de Cálculo
5.5 Procedimiento de Calculo para datos Agrupados
5.6 Obtención de los valores correspondientes cuando el
número de datos es distinto de 100
5.7 Ejercicios en clase.
5.8 Ejercicios de aplicación.
Capítulo 6
6 Teoría elemental de Probabilidades
Capítulo 7
7 Análisis Combinatorio y Probabilidades
7.1 Principio fundamental del análisis combinatorio
7.2 Factorial de n
7.3 Permutaciones
7.4 Combinaciones
7.5 Probabilidades y Análisis Combinatorio
7.6 Generalización del número combinatorio y probabilidades
7.7 Ejercicios de aplicación
Capítulo 8
8 Las Distribuciones Binomial, Poisson y Normal
8.1 La Distribución Binomial
8.2 Distribución de Poisson
8.3 Relación entre la Distribución Binomial y la Distribución de
Poisson
8.4 La Distribución Normal, Curva Normal o Distribución
Gaussiana.
8.5 Relación entre la Distribución Binomial y la Normal
8.6 Ejercicios de comprensión sobre la Distribución Normal
8.7 Distribución Hipergeométrica.
8.8 Aproximación Normal a Binomial
8.98 Ejercicios de aplicación.
Capítulo 9
9 Correlación y Regresión
9.1 Introducción
9.2 Análisis de Correlación
9.3 Análisis de Regresión
9.4 Ejercicios de Aplicación
Capítulo 10
10 Teoría del muestreo.
10.1 Muestreo aleatorio.
10.2 Distribución de muestreo.
10.3 Muestreo de poblaciones pequeñas.
Capítulo 11
11 Estimación
11.1 Estimación por punto y por intervalo
11.2 Intervalo de confianza
11.3 Estimación de la media aritmética.
11.4 Margen de error y coeficiente de confianza.
11.5 No siempre se conoce el valor de la desviación típica
poblacional.
11.6 Distribución t, o Distribución de Student.
11.7 Intervalos de confianza para las proporciones o porcentajes
de defectuosos.
Capítulo 12
12 Números Índices.
12.1 Relaciones de precios.
12.2 Relaciones de Cantidad o de Volumen
12.3 Relaciones de valor
12.4 Relaciones de Enlace y en Cadena.
12.5 El método de agregación simple.
12.6 El método de agregación Simple de relaciones.
12.7 El método de agregación ponderada.
12.7.1 Indice de Laspeyres.
12.7.2 Indice de Paasche.
12.8 Deflación de series en el tiempo.
Capitulo 13
13 Series de Tiempo
13.1 Análisis de series en el tiempo
13.2 Estimación de las variaciones estacionales. El Índice
Estacional
13.3 Ejercicios de Aplicación
Capitulo 14
14 Pruebas de Hipótesis
14.1 Hipótesis Estadísticas.
14.2 Contrastes de Hipótesis y significación, o reglas de
decisión.
14.3 Errores de Tipo I y de Tipo II .
14.4 Nivel de significación.
14.5 Contrastes mediante la distribución normal.
14.6 Tres distintos niveles de significancia.
14.7 Selección de un nivel de significancia.
14.8 Uso de la distribución t para la toma de decisiones.
14.9 Ejercicios de aplicación desarrollados.
14.10 Ejercicios de Aplicación.
Capitulo 15
15 Análisis de Varianza
15.1 Distribución F
15.2 Análisis de Varianza y Cálculo de F, con una variable de
clasificación.
Bibliografía
Santiago de Chile.
Marzo de 2006.
Capítulo 1
1.1 Introducción al concepto de la Estadística
Sin embargo, la Estadística nos ofrece un camino, más corto, más rápido y
conveniente para obtener la información, suficientemente válida y muy cercana al
dato anterior.
Imaginemos que tenemos un gran recipiente donde colocáramos tantas fichas como
alumnos y cada ficha tuviera el dato de la edad de cada alumno. Ese gran recipiente
sería nuestro Universo o Población.
Alguien con sentido común propondría tomar algunas fichas al azar y calcular el
promedio de dicho pequeño grupo de unidades. Intuitivamente podremos aceptar
que el dato obtenido no necesariamente será el valor verdadero del total de las
fichas, pero sin duda guardará cierta relación y además será la mejor información
disponible.
DEFINICION DE ESTADISTICA
1.2 Gráficos
Otros Gráficos
Gráfico de trazos
Gráfico de Barras
1.3, 1.4, 1.5, 1.6, 1.8, 1.9, 1.10, 1.16, 1.17, 1.18, 1.19, 1.20, 1.21, 1.22, 1.23, 1.24,
1.23, 1.27, 1.29, 1.30, 1.48, 1.52, 1.59, 1.71, 1.76.
Capítulo 2
2.1 Distribuciones de frecuencias, Histogramas
Cuando se realiza una recolección de datos muy extensa, por ejemplo, 50 o más
datos, resulta muy difícil interpretar la información recibida.
Una primera investigación que podríamos realizar, sería la de encontrar el mayor
valor y el menor de ellos lo cual nos informaría acerca del INTERVALO el cual se
encuentran todos los datos.
Lo segundo podría ser ordenarlos de menor a mayor, pero aun seguiría siendo una
larga lista de números.
El siguiente procedimiento, nos permitirá ordenarlos e interpretar valiosa información
estadística.
Este ordenamiento consiste en crear CLASES, dentro de las cuales clasificaremos
los datos. El procedimiento es dividir la distancia del INTERVALO en intervalos más
cortos que llamaremos clases. La pregunta que nos haremos es: ¿en cuantas clases
dividiremos el INTERVALO?
Existe una regla empírica, (práctica) que dice lo siguiente:
Si el total de datos es n, el número de clases que buscamos será n
Para entenderlo mejor, haremos un ejemplo.
Supongamos que se han tomado 84 datos de una medida de diámetros de ejes para
un instrumento de precisión.
Los datos tal como se obtuvieron son:
881 880 905 933 872 861 882 877 890 898 863 896 878 906
886 875 890 928 911 955 893 867 920 879 899 897 870 883
885 883 889 874 878 904 939 901 894 859 886 865 902 867
889 874 891 925 866 869 868 894 891 901 912 892 921 895
910 915 846 892 885 866 910 885 916 915 923 857 891 889
912 907 881 893 905 924 876 903 887 901 888 907 880 882
El INTERVALO es 109
Para ello procederemos a marcar con un pequeño trazo vertical, cada dato dentro de
su clase, Por ejemplo, los números 881 y 880, pertenecen a la clase 4 y el número
905 a la clase 6. De esta forma se registran los 84 datos.
Así se construye la siguiente tabla:
Este perfil obtenido con el diagrama de frecuencias ya nos está dando valiosa
información estadística, vemos que los datos están concentrados con preferencia
alrededor de la CLASE 4 y que un valor representativo del grupo debería estar
dentro de esa clase.
Por lo tanto, la MARCA DE CLASE del grupo 1 será 851.En éste punto recordaremos
que al principio de éstos cálculos mencionamos que era conveniente utilizar un
número impar. Ahora explicaremos el porqué de esa recomendación.
DISTRIBUCIÓN DE FRECUENCIA:
Distribución de Frecuencia:
MARCA DE FRECUENCIA
CLASE (X)
DE CLASE
851 1
862 9
873 11
884 19
895 16
906 14
917 7
928 5
939 1
950 1
84
HISTOGRAMA
FRONTERA DE CLASE:
Para terminar de interpretar los HISTOGRAMAS, el alumno puede imaginar que los
valores de las fronteras de clases, están exactamente en las líneas que separan
cada uno de los bloques del HISTOGRAMA.
2.2 Distribuciones de Frecuencias Acumuladas y Ojivas
La frecuencia total de todos los valores menores que la frontera de clase superior de
un intervalo de clase dado se llama FRECUENCIA ACUMULADA hasta ese intervalo
de clase inclusive.
Una tabla que presente tales frecuencias acumuladas se denomina una
DISTRIBUCIÓN ACUMULADA.
Nota: la frecuencia relativa coincide con las frecuencias, simplemente por n=100, si n
es cualquier otro valor, ambas columnas, no coincidirán.
Capítulo 2:
Para resolver estos problemas, el alumno deberá usar los métodos y criterios
vistos en clase, los cuales difieren de los usados en el libro.
Distribución de frecuencias: 2.2, 2.3, 2.6, 2.7, 2.20, 2.21, 2.23, 2.26, 2.27, 2.28,
2.29.
Capítulo 3
3 Promedios
N
NOTACIÓN DE SUMA: X
J 1
J X1 X 2 ... XN
MEDIA ARITMÉTICA =
Muy frecuentemente, uno o varios datos de los registrados se repiten, es dicho caso
la fórmula anterior de interpreta de la siguiente manera:
Si los datos : X1 , X 2 ,..., XN se repiten con frecuencia f1 , f2 ,..., fk veces,
entonces la MEDIA ARITMÉTICA se define de la siguiente forma:
k
f . X f . X ... fk . Xk
fX
j 1
j j
X 1 1 2 2 k
f1 f2 ... fk
f
j1
j
3 * 5 2 * 8 4 * 6 1* 2
X 5.7
3 2 41
Con respecto a los índices utilizados en las fórmulas de las medias, el estudiante
habrá notado que en la primera fórmula, el subíndice utilizado, es N, esto es el total
de unidades consideradas y en el segundo caso, cuando hay repetición de algunos
datos, el subíndice utilizado es k.
En éste último caso k es el numero de datos distintos, sin repetición, de ésta manera,
la sumatoria de las frecuencias será igual a N
Datos Frecuencia
3 2
4 1
5 3
8 5
9 3
Propiedad Nº 1
Ejemplo:
total: +0.00
Probar genéricamente que la suma de las desviaciones de X1, X2, ... Xn respecto de
su MEDIA ARITMÉTICA es cero
Entonces:
n n
dj
j 1
X
j 1
J
X X X X X
X NX X
N X
X X 0
N
Propiedad nº 2
(X
j1
j a)2 minimo
si y solo si a= X
Esta propiedad la podemos comprobar usando los datos que se dieron en el ejemplo
de la propiedad nº 1
Propiedad nº 3
Si n1 números tienen media m1, y n2 números tienen media m2, y ..., nk números
tienen media mk , entonces la media de todos los números es:
Veamos un ejemplo:
X
nm 90 * 230.000 75 * 325000 273.182
n 90 75
Propiedad nº 4
X A+
d
N
X A+
fd
N
Donde: N = f
Si N números, X1, X2, ...,XN, tienen desviaciones respecto de un número A, dadas por:
d1 = X1 - A
d 2 = X2 - A
... ... ...
dN = XN - A
Probar que :
X A+
fd
N
Solución:
Como dj = Xj - A
es X j = A + di
b) Para el caso en que X1, X2, ...,XN tengan frecuencias f1, f2, ..., fN y
d1 = X1 - A
d2 = X2 - A
dk = Xk - A
Probar que:
Pues f = N
X
fX
N
X A+
fd
N
fu
X A + c
N
Altura = X frecuencia
1.55 05
1.64 18
1.73 42
1.82 27
1.91 08
f=N=100
Altura = X frecuencia fX
1.55 05 07.55
1.64 18 29.52
1.73 42 72.66
1.82 27 49.14
1.91 08 15.28
f=N=100 fX=174.35
Debemos partir haciendo una conjetura de cual puede ser la media del conjunto de
datos, observando la distribución es fácil concluir que la media aritmética se
encontrará cerca de 1,73 metros.
X A
fd 1.73 1.35 1.74
N 100
En éste cálculo deberemos aplicar el concepto: d = cu, siendo u una variable que
puede ser: 0, ±1, ±2, ±3, etc.
X f u fu
1.55 5 -2 -10
1.64 18 -1 -18
1.73 42 +0 +00
1.82 27 +1 +27
1.91 8 +2 +16
f=100 fu=15
fu 15
X A c 1.73 0.09 1.74
N 100
3.6 La Mediana
La MEDIANA es el número 9, pues antes que él, hay 3 números y después de él hay
otros 3.
Cinco empleados de una Empresa, ganan $4.52, $5.96, $5.28, $11.2, y $5.75 la
hora.
Hallar la MEDIANA, y la MEDIA ARITMÉTICA.
Lo primero que debemos hacer es ordenar los datos: 4.52, 5.28, 5.75, 5.96, 11.20
Como puede apreciarse, la MEDIANA, no está afectada por el valor extremo 11.20,
tal como lo está la MEDIA ARITMÉTICA. El valor 6.54 esta fuertemente sesgado
(corrido) hacia la derecha por causa de un valor que no parece ser del grupo al cual
corresponden los otros cuatro datos. Esta cualidad hace que la MEDIANA sea muy
útil para el estudio de sueldos
Ejercicio:
En la tabla que sigue, se estudian los pesos de 40 unidades de un producto X, con la
precisión de 1 gramo. Construir la tabla de frecuencias, hallar la media aritmética, y
calcular la mediana por interpolación y por cálculo directo
138, 146, 168, 146, 161, 164, 158, 126, 173, 145, 150, 140, 138, 142, 135, 132, 147,
176, 147, 142, 144, 136, 163, 135, 150, 125, 148, 119, 153, 156, 149, 152, 154, 140,
145, 157, 144, 165, 135, 128
Los pesos máximo y mínimo son: 176 y 119, el intervalo o rango es 57. Elegiremos
un ancho impar = 7. El diagrama de frecuencias resultante es:
fu 12
X A c 149 7 147
f 40
X 147
f ___
118-124 121 / 1 Por lo tanto, para “llegar” al dato 20,
que sería el
125-131 128 /// 3 de la MEDIANA, necesitamos 1, que lo toma-
132-138 135 ///// // 7 19 datos remos de la clase 149
139-145 142 ///// /// 8 __
146-152 149 ///// //// 9 _ _
153-159 156 ///// 5 El cálculo interpolando, será por regla
de tres
160-166 163 //// 4 12 datos
167-173 170 // 2 Si 9 datos, producen un salto de 7 en la
escala
174-180 177 / 1 _ _ de las X, 1 producirá,
proporcionalmente 0.8
Para hallar la MEDIANA sumaremos este valor hallado, 0,8 a la frontera de la clase
correspondiente, en éste caso, 145.5,
Por último, podríamos darnos la tarea de ordenar todos los datos, y encontrar el
valor 20 y 21 y hallar la media:
119, 125, 126, 128, 132, 135, .................., 145, 145, 146, 146, 147...........
1. 2, 3, 4, 5, 6, ................., 18, 19, 20, 21, 22..........
3.7 La Moda
G N X1 . X 2 . ... . XN
G 3 2.4.8 3 64 4
3, 5, 6, 6, 7, 10 y 12
Ejercicio 3 : Los números X1,X2, ... XK ocurren con frecuencia f1, f2 ... fk
Ejemplo: Una persona viaja de A a B con una velocidad media de 40 km. por hora y
regresa a 100 Km. por hora. La distancia entre A Y B es de 400 Km.
Entonces:
Tiempo para ir de A a B =
Tiempo para ir de B a A =
Velocidad promedio:
H G
3.11 Ejercicios en clase.
Capítulo 3
Media Aritmética: 3.6, 3.7, 3.8, 3.9, 3.10, 3.11, 3.19, 3.23, 3.24, 3.55, 3.59, 3.60,
3.61.
Mediana: 3.28, 3.29.
Moda: 3.31
Capitulo 4
4 Medidas de la dispersión de una distribución de datos.
La dispersión o variación de los datos intenta dar una idea de cuán repartidos se
encuentran éstos.
Hay varias medidas de tal dispersión, siendo las más comunes el RANGO o
INTERVALO y la DESVIACION TIPICA.
Existen otros estimadores, pero están fuera del propósito de éste curso.
Ejercicio:
Solución:
Si X1, X2, ...,Xk se repiten con frecuencias f1, f2, ..., fk, la desviación típica se expresa
como:
pues f=N
Sobre el tamaño de N:
Hay un aspecto importante con respecto al tamaño de N. Si N es 30 o menor a 30, el
cociente en la fórmula, deberá ser N – 1. La demostración de esta conveniencia no
entra en los alcances de este curso, pero debe considerarse que la respuesta es
mejor cuando se divide por N – 1. Esta consideración es extensiva a todos los
desarrollos de fórmulas que veremos a continuación.
media aritmética.
El alumno tiene que tener muy claro a esta altura del desarrollo de la materia, los
conceptos de UNIVERSO O POBLACION y de MUESTRA.
El UNIVERSO O POBLACION son todos los individuos que lo componen, por
ejemplo, todos los estudiantes del país del INACAP o la producción de clavos de todo
un día.
MUESTRA es una cantidad estadísticamente seleccionada y tomada al azar que
representa al UNIVERSO O POBLACION.
Ejercicios de comprensión:
a) X
X 76
9.5 b) X
72
9
N 8 8
a) b)
Ejercicio:
Las fórmulas vistas en la definición no son prácticas para el cálculo, por lo cual
haremos ciertas transformaciones, con la finalidad de que los cálculos sean
minimizados.
Marca de f X2 fX2
clase
1.55 05 2.40 12.01
1.64 18 2.69 48.41
1.73 42 2.99 125.7
1.86 27 3.31 89.43
1.95 08 3.65 29.18
f=100 fX2=304.75
304.75
S 1.7435 2 0.09
100
Ahora bien, con ésta segunda fórmula podemos hacer el mismo desarrollo que
hicimos con la primera y el resultado será el mismo, por lo tanto la fórmula 2 es
X f d=X-A fd fd2
1.55 05 -0.18 -0.90 0.16
1.64 18 -0.09 -1.62 0.15
1.73 ==> A 42 +0.00 +0.00 0.00
1.82 27 +0.09 +2.43 0.22
1.91 08 +0.18 +1.44 0.26
f=100 fd = 1.35 fd2 = 0.79
d=c*u
Esta variable u toma los valores : ...-2, -1, 0, +1 , +2, ... etc.
X f u fu fu2
1.55 05 -2 -10.00 20.00
1.64 18 -1 -18.00 18.00
1.73 42 +0 +00.00 00.00
1.82 27 +1 +27.00 27.00
1.91 08 +2 +16.00 32.00
f = 100 fu = 15 fu2 = 97
Propiedad nº 1
Propiedad nº 2
4.6 Varianza
Desviación Media:
Ejemplo:
2, 3, 6, 8,11
Media Aritmética: 6
2 6 3 6 6 6 8 6 11 6
DM 2.8
5
Si X1, X2, ...,Xk se repiten con frecuencia f1, f2, ..., fk,
f X
j 1
j j X
fX X
DM X X
N N
k
Donde: f f N
j1
Ejercicio:
b) 3, 8, 8, 8, 9, 9, 9, 18.
Solución:
DM
X X
34
4.25
N 8
DM
X X
18
2.25
N 8
Ejercicio:
DM
fX X
6.69
0.07
N 100
50 42
1.67 1.81
40
Frecuencias
27
30
18
20
8
10 5
0
1,55 1,64 1,73 1,82 1,91
1,685 1,775
Es decir nos interesa saber cuantos alumnos se encuentran dentro del intervalo de
1.67 a 1.81 mts.
Este intervalo incluye a todos los integrantes de la tercera clase, los 42, más,
Es decir que entre más 1DM y menos 1DM se encuentran el 55.5 % de los
estudiantes.
Es decir que entre más 2DM y menos 2DM se encuentran el 87.3 % de los
estudiantes.
Es decir que entre más 3DM y menos 3DM se encuentran el 98.6 % de los
estudiantes.
Capítulo 5
5 CUANTILOS
5.1 DEFINICIÓN:
Con el mismo criterio podremos encontrar los valores que dividen serie en 4 partes
iguales, es decir, si tenemos una serie de 100 datos, ordenados de menor a mayor,
los datos números 25, 50 y 75 dividen la lista en 4 partes iguales.
Por ésta razón, estos cuantilos se denominan : CUARTILOS
Si la serie no fuera de 100 datos, fuera por ejemplo de 180, los datos buscados
serian el 45, el 90 y el 135. Es decir aquel valor que separe el 25%, el 50% y el 75%.
Con el mismo criterio, existen los DECILES, que dividen la serie en 10 partes y los
PERCENTILES, que dividen la serie en 100 partes iguales.
Una buena propiedad de los cuantiles es que no están afectados por los valores
extremos o de borde, los cuales a veces reflejan anomalías o valores que se apartan
de la distribución por causas específicas. Los cuantilos utilizan valores que están
adentro de la distribución y por lo tanto son valores normales.
Para medir la tendencia central comenzamos por definir los estimadores del
PROMEDIO o valor central de la distribución:
INTERVALO CUARTÍLICO: Q3 - Q1
INTERVALO PERCENTIL 10,90 : C90 - C10
INTERVALO SEMI INTERCUARTÍLICO : (Q3 - Q1)/2
INTERVALO SEMI PERCENTÍL 10,90 : (C90 - C10)/2
MEDIANA = Q2 = D5 = P50 = 56
Nótese que el estudio se realizó sobre 99 datos y no sobre 100, pues con 99 se logra
la simetría perfecta para cada uno de los cuantilos. Por ejemplo, la Mediana tiene 49
datos a cada lado del dato 50, Q1 tiene 24 datos anteriores, y Q3 24 datos
posteriores, etc.
Como puede observarse, los resultados son bien diferentes, esto se debe a varios
factores, en primer lugar, la distribución de los datos seleccionados, no son simétricos
ni se parecen a una distribución Normal o Gaussiana. Si bien aún no hemos
estudiado el tema de la distribución NORMAL o Gaussiana, el alumno ya puede
formarse una idea de que esta importante distribución es de forma de campana, y
tiende a ser simétrica.
La distribución que hemos utilizado no lo es, y eso asegura que los distintos
estimadores estadísticos difieran entre si. La pregunta es entonces: ¿para que
sirven? La respuesta es: para comparar, es decir, podemos comparar sucesivas
distribuciones entre sí, y ver si se dispersan más o menos que la anterior y si los
valores centrales se acercan a lo que se especifica. ¿Cual usar?, el que a criterio del
analista responda mejor a los objetivos que se buscan. Lo importante es que una vez
determinado cual será el estadístico a utilizar, seamos coherentes y utilicemos para
comparar siempre el mismo estadístico.
Resultado, Q1 = 1,69
Por último y para dejar el tema completo, calcularemos otro dato, en éste caso, el
valor del percentilo 90, es decir P90.
Se sugiere al alumno, calcular P10 y con ambos valores calcular el intervalo semi
percentílico y el promedio correspondiente.
Por razones pedagógicas, se ha utilizado una distribución de 100 datos para hacer
estos cálculos, pero el alumno debe saber encontrar cualquier dato en una
distribución dada. Daremos dos ejemplos:
Ejemplo uno:
Ejemplo dos
Capítulos 3 y 4:
Cuantílos: 3.44, 3.107, 3.108, 4.6, 4.7, 4.8, 4.48, 4.52.
Capítulo 6
6 Teoría elemental de Probabilidades
h
p PrE
n
n h h
q PrnoE 1 1 p 1 PrE pues p + q = 1
n n
Si en una serie de 1000 tiradas de una moneda salen 529 caras, la frecuencia
relativa es de 529/1000 = 0,529.
Si en otras 1000 veces, salen 493, la frecuencia relativa acumulada será:
(529+493)/2000=0.511.
Si continuamos indefinidamente con éste método, el límite será 0,50000.....
Certeza absoluta
Imposibilidad absoluta
Casos favorables
P
Total de casos
0 P 1
ó 0 P 100
Es decir, estos sucesos son excluyentes entre sí, son EXCLUYENTES entre si, se
eliminan uno a otro. Si ocurre un suceso, no puede ocurrir el otro.
Para estos casos, se aplica la regla de la adición de las probabilidades que dice:
Pt Pi
Del ejemplo precedente, se ve que la probabilidad total, en estos casos, esa menor
que la menor probabilidad de los sucesos intervinientes.
Es decir:
Pt Pi
El alumno deberá notar que las probabilidades en la segunda regla son menores que
en la primera regla, la circunstancia de que la regla de multiplicar, intuitivamente
generadora de valores mayores que la suma, se explica por la circunstancia de que la
multiplicación se efectúa con números decimales, y esto arroja siempre un valor más
pequeño, ejemplo:
Este problema parece el mismo que el anterior pero no es así. el 4 ó el 5 puede salir
en cualquiera de los dados. Supongamos que un dado es rojo y el otro azul.
Podemos obtener 4 en el rojo y 5 en el azul. o bien 5 en el rojo y 4 en el azul. en
ambos casos satisfacemos lo que el enunciado pide.
Si sale 4 en el rojo (suceso simple), nada impide que salga el 5 en el azul. Entonces
corresponde el producto de las probabilidades.
Lo mismo ocurre para el 4 en el azul y el 5 en el rojo.
Pero, si sale 4 en el rojo y 5 en el azul(suceso compuesto) no puede salir el 5 en el
rojo y el 4 en el azul. Por lo tanto corresponde la suma de las probabilidades de cada
uno de estos sucesos compuestos.
que salga 3 y 6 ó 4 y 5 ó 6 y 3 ó 5 y 4
Para aclarar el tema desarrollemos un suceso muy simple, supongamos que tenemos
una Población de 10 especiímenes, y que tenemos que extraer dos unidades, la
probabilidad de la primera extracción es de 1/10=0.1000, ahora bien, la segunda
extracción tendrá distinta probabilidad según lo que hagamos con el primer
espécimen, si lo volvemos a la población, la probabilidad volverá a ser de 1/10, pero
si no lo volvemos, la población es ahora de 9 especiímenes, por lo tanto, la
probabilidad de la segunda extracción será 1/9= 0.1111
Veamos otro ejemplo, Calcular la probabilidad de hallar una pieza defectuosa y otra
buena si se toman dos piezas de un lote de 20 piezas cuya fracción defectuosa es
del 5%.
Con reposición:
Por lo tanto la probabilidad de que la primera sea buena y la segunda mala es:
Pero, otro resultado posible, y que también satisface el enunciado del problema es
que la primera sea mala y la segunda buena, el resultado será el mismo:
Sin reposición
19 1
Pa * 0.05
20 19
1 19
Pb * 0.05
20 19
En la práctica, lo más frecuente es que las extracciones sean sin reposición, pero
también sucede que las poblaciones son cantidades grandes, y cuando así sucede,
la modificación que se produce en la población por sucesivas extracciones no son
significativas para el cálculo de probabilidades.
Se escoge una urna al azar y de la misma se extrae una bolilla, también al azar,
obteniendo una bolilla blanca, es decir que el suceso b se ha producido.
Donde:
Por lo tanto la probabilidad de que la urna sea del grupo A , si la bolilla es blanca:
Ejercicios de comprensión:
Los siguientes problemas se les sugieren resolver al alumno. Los resultados están al
terminar el enunciado.
Problema 1:
Se tiene un grupo M formado por 4 urnas, con 4 bolillas rojas y 2 azules cada una.
Otro grupo N, formado por 6 urnas conteniendo cada una 3 bolillas rojas y 5 azules.
Se selecciona una urna al azar del grupo de diez y de ella se extrae una bolilla,
también al azar, resultando roja.
Respuesta: 45.80%
Problema 2 :
Supongamos que una caja contiene bolillas blancas y rojas marcadas con P; Q; ó R
como sigue:
Capítulo 6:
Probabilidades: 6.3, 6.5, 6.6, 6.8, 6.33, 6.42, 6.43, 6.44, 6.45, 6.46, 6.47, 6.50,
6.51, 6.90.
Capítulo 7
7. Análisis Combinatorio y Probabilidades
El análisis combinatorio nos provee una herramienta muy importante para el cálculo
de probabilidades complejas y que no podríamos valorizar con los métodos que
hemos aprendido hasta ahora. Este cálculo matemático se unirá a lo visto en el
capítulo anterior para desarrollar lo que llamaremos distribución binomial en el
próximo capítulo
n1 * n2
Ejemplo: Si hay 3 candidatos para gobernador y 5 para alcalde, los dos cargos se
pueden ocupar de 3 * 5 = 15 formas.
7.2 Factorial de n.
n! : n(n-1)(n-2)....3*2*1
.
Ejemplos:
5! = 5*4*3*2*1 = 120
Y se define:
Factorial del número cero = uno
0! = 1
7.3 Permutaciones.
Pn,n = n!
P(3,2) = 3*2 = 6
7.4 Combinaciones.
3 3.2.1
3
2 2.1
Son ab, bc y ac
d) Para resolver este caso, que al menos una sea blanca, tenemos dos caminos, el
primero sería calcular la probabilidad de que una sea blanca, de que dos sean
blancas y que las tres sean blancas y luego sumar los tres resultados. Pero otro
camino, que suele ser más corto, es calcular que ninguna sea blanca y esto restarlo
de uno. Nosotros resolveremos por el segundo camino y se sugiere al alumno que lo
confirme por la otra vía.
e) Una de cada color. Aquí debemos prestar atención de que no están pidiendo que
salgan en un orden determinado, El cálculo por la vía del número combinatorio nos
da precisamente el resultado acumulado de todas las alternativas posibles.
_ _ _ _ _
Por ejemplo:
6 6 6 6 6
o
6 6 6 6 6
Ahora bien la probabilidad de un suceso como cualquiera de los dos descritos es:
3 2
1 1 5 1 5 1 5
P 66666 * * * *
6 6 6 6 6 6 6
5
la respuesta es 10 de tales sucesos mutuamente EXCLUYENTES por lo
3
tanto la probabilidad requerida es:
Capítulo 6:
Permutaciones: 6.17, 6.18, 6.19, 6.20, 6.21, 6.22, 6.24, 6.66, 6.71,
Combinaciones: 6.25, 6.26, 6.27, 6.28, 6.29, 6.30. 6.72, 6.74, 6.75, 6.78.
Probabilidades y análisis combinatorio: 6.32, 6.33, 6.34, 6.35.
Capítulo: 8
LAS DISTRIBUCIONES BINOMIAL, POISSON Y NORMAL.
N N!
PX p X qN X p X qN X
X X !N X!
N=6, p=½,q=½,X=2
Se dice que una variable es discreta, cuando los datos se cuentan, y es continua
cuando los datos se miden. por ejemplo, la producción de sillas es discreta pues un
lote puede ser, por ejemplo de 25 sillas o de 43 sillas, pero no de 25,6 ó 43,25 sillas
pues la fracción no es silla. En cambio, el diámetro de un perno es una variable
continua pues la puedo medir con tanta precisión como resolución tenga el
instrumento, ejemplo 12,345 milímetros.
N N
q pN qN qN 1p qN 2 p 2 ... p N
1 2
donde:
N N
1, , ,... se llaman
1 2
Coeficientes Binomiales
VARIANZA : Npq
TRIÁNGULO DE PASCAL
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
....................................................
Si generalizamos tenemos:
q pN P0 P1 P2 ... PN
Por otra parte, q+p = 1 por lo cual la suma anterior también es igual a uno.
En otra palabras, la probabilidad de que el suceso esperado se cumpla cero vez, una
vez, dos veces, hasta N veces, es igual a uno.
Si graficamos en un sistema de coordenadas un polígono de frecuencias, que
represente la distribución binomial, tenemos:
P (X) P(Np)
...
...
...
...
P(3) P(3) P(n-3)
P(2) P(2) | | P(n-2)
P(1) P(1) | | | | P(n-1)
P(0) P(0) | | | | | | P(n)
0 1 2 3 ... Np ... n-3 n-2 n-1 n
EJERCICIOS DE COMPRENSIÓN
p = variará desde 0,10 hasta 0,90 y, en consecuencia, q = variará desde 0,90 hasta
0,10
X = serán todas las posibles, es decir: 0, 1, 2, ...., hasta 10
si p es igual a 0,20
35
30
probabilidad
25
20
15
10
0
0 2 4 6 8 10
valor de las X
si p es igual a 0,30
30
25
probabilidad
20
15
10
0
0 2 4 6 8 10
valor de las X
si p es igual a 0,40
30
25
probabilidad
20
15
10
0
0 2 4 6 8 10
valor de las X
25
si p es igual a 0,50
20
probabilidad
15
10
0
0 1 2 3 4 5 6 7 8 9 10
si p es igual a 0,60
30
25
probabilidad
20
15
10
0
0 2 4 6 8 10
valor de las X
si p es igual a 0,70
30
25
probabilidad
20
15
10
0
0 2 4 6 8 10
valor de las X
si p es igual a 0,80
35
30
probabilidad
25
20
15
10
0
0 2 4 6 8 10
valor de las X
si p es igual a 0,90
40
35
30
probabilidad
25
20
15
10
5
0
0 2 4 6 8 10
valor de las X
N
PX X
p q
N X
X
se reduce a:
Xe
PX donde X = 0, 1, 2,...
x!
PX
NpX e Np
X!
BINOMIAL POISSON
MEDIA = Np =
VARIANZA 2 = Npq 2 =
DESVIACIÓN TÍPICA = =
Ejercicio de comprensión:
a) cero llamadas
b) una llamada
c) dos llamadas
d) tres llamadas
e) cuatro llamadas o menos
f) más de seis llamadas
El área total bajo la curva es igual a uno, (o 100%), significa que el 100% de las
probabilidades están representadas por la curva. Consecuentemente, el área bajo la
curva entre X=a y X=b con a < b representa la probabilidad de que X esté entre a
y b . Esta probabilidad se denota por:
VARIABLE CANÓNICA : Z
Z
X
Estas unidades Estandard o unidades de Desviación Típica, ( pues está dividido por
sigma ) transforma a la ecuación de Gauss en la siguiente:
1 1 Z2
Y e 2
2
Esta fórmula, que es única, igual para cualquier población, con tal de que calculemos
el valor de Z, tiene la siguiente representación:
30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
VALORES DE Z
Área bajo la curva normal desde MENOS UNA DESVIACIÓN TÍPICA (-1) hasta
MAS UNA DESVIACIÓN TÍPICA (+1)
30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
DESDE -1 A +1 DESVIACION TIPICA
30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
DESDE -2 A +2 DESVIACION TIPICA
PROBABILIDADES
30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
DESDE -3 A +3 DESVIACION TIPICA
Los siguientes ejercicios, tienen como objetivo aprender el uso de las tablas de
Gauss.
EJERCICIO Nº 1
Hallar el área bajo la CURVA NORMAL en cada uno de los casos siguientes:
a) entre z = 0 y z = 1.20
b) Entre z = - 0.68 y z = 0
35
PROBABILIDADES
30
25
20
15
10
0
-3 -2 -1 0 1 2 3
Area entre z = -1,28 y z = + infinito
EJERCICIO Nº 2
Si los diámetros de las bolillas de cojinetes están normalmente distribuidas con media
0.6140 mm y desviación típica 0.0025 mm determinar el % con diámetro :
Solución:
a)- z = (0.6100-0.6140) / 0.0025 = - 1.60
La probabilidad de que el diámetro de las bolillas sea mayor que 0.6170 mm es del
11.51%
Probabilidad = 0.82 %
Ejercicios en clase:
Ejemplo 1: determinar la nota mínima para el 10% mejor de un curso con media 65 y
desviación típica 9.
L d d
c n c c
P
n L
n
L = Tamaño del Lote (Población)
d = Unidades defectuosas en el Lote
n = tamaño de la muestra.
c == Unidades defectuosas en la muestra.
Para c = 0
Para c = 1
20 2 2
1
5 1 1
P 0.395
5 20
5
Para c = 2
20 2 2
2 5 2 2
P 0.053
5 20
5
Téngase presente que de los tres resultados, los únicos correctos son los de la
Hipergeométrica, y en los otros datos puede apreciarse el grado de error con los
resultados correctos.
Problema:
Solución:
L = 70 n=3 p = 0,10
d=7 c=0
70 7 7
0 3 0 0
P 0.7254
3 70
3
Respuesta: 72.54 %
Para: n = 12 y p = 1/3
0,238
0,212
0,191
0,127
0,111
0,046 0,048
0,008 0,015
0,0030
0 2 4 6 8 10 12
Distribución binom ial para p=1/3 y n=12
La curva normal, superpuesta, tiene los datos calculados con la fórmula anterior:
resulta evidente que existe una buena aproximación, pese a que n es solo 12.
0 2 4 6 8 10 12
Distribución binomial para p=1/3 y n=12, con curva
norm al superpuesta
Por lo tanto, al aproximar esta probabilidad por los métodos de la curva normal, se
necesita encontrar el área bajo la curva normal, a la derecha de 5.5.
Puesto que la curva normal, fue construida con = 4 y = 1.63 se sigue que:
x - 5.5 4
z 0.92
1.63
Por Gauss, la respuesta la da el área bajo la curva normal entre 5.5. y 6.5.
6.5 4
z2 1.53 A 2 0.4370
1.63
5.5 4
z1 = 0.92 A 1 0.3212
1.63
Restando una de otra área, el resultado es : 0.116, que, comparada con 0.111
también es una buena aproximación.
x np
z
npq
x
p
z n
pq
n
Es decir que, cuando los datos son entregados en la forma de proporción de éxitos, o
fracción defectuosa, la curva normal de aproximación, será la que se obtiene
utilizando
p
y
pq
n
Capítulo 7
Distribución Binomial: 7.1, 7.2, 7.3, 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 7.42, 7.43, 7.40,
7.44.
Distribución Normal: 7.14, 7.15, 7.16, 7.17, 7.18, 7.20, 7.21, 7.22, 7.23, 7.49, 7.50,
7.51, 7.52, 7.54, 7.57, 7.58.
Aproximación normal a binomial: 7.24, 7.25, 7.26.
Distribución de Poisson: 7.27, 7.28, 7.29, 7.67, 7.68, 7.71
Capitulo 9
Correlación y Regresión
9.1 Introducción
x y x y x y x y x y x y
34 37 28 30 39 36 35 35 33 31 34 32
37 37 30 34 33 29 29 36 32 31 36 38
36 34 32 30 30 29 34 37 33 36 34 31
32 34 41 37 33 40 35 39 37 40 38 40
32 33 38 40 43 42 36 40 36 42 31 29
45
43
41
Notas de ciencias
39
37
35
33
31
29
27
25
25 27 29 31 33 35 37 39 41 43 45
Notas de lenguaje
Una simple inspección visual, nos sugiere que existe una razonable relación entre los
puntos, la nube sugiere una tendencia a crecer, es decir, a mejores notas en
ciencias, mejores notas en lenguaje, y viceversa. Esta “sugerencia” es la
CORRELACIÓN, y nuestro interés ahora es medir esa relación entre los valores.
Por otra parte, el aspecto general del diagrama de dispersión, es el de una línea
recta. Para determinar la naturaleza de una tendencia, se busca cualquier propensión
de los puntos de agruparse sobre ambos lados de alguna curva simple o bien a
ambos lados de una línea recta. Para estas variables seria conveniente poder medir
en alguna forma el grado en que ambas variables se encuentran relacionadas
linealmente. Con el objeto de obtener esta medida, considérense las propiedades
que seria conveniente que tuviera.
Una medida de la relación tendrá que ser independiente de la elección del origen
para las variables. Esta propiedad puede obtenerse usando las desviaciones de las
variables mismas. Esto es igual a la definición de la Desviación Típica.
ui
x X
i
y vi
y Y
i
x y
Con estas variables podemos volver a representar el diagrama de dispersión. Este
será ahora un DIAGRAMA DE DISPERSIÓN PARA VALORES NORMALIZADOS.
Las coordenadas se cortan en un punto central del diagrama, pero el perfil de la nube
de puntos, continua siendo exactamente el mismo
0
-3 -2 -1 0 1 2 3
-1
-2
-3
Este comportamiento sugiere una relación entre las variables, una medida simple de
esta relación es la siguiente:
n
uv
i1
i i
x i
X yi Y
r i 1
n 1sx sy
El resultado de esta ecuación es un número que va desde cero a uno, siendo, cero,
la inexistencia de correlación, y uno la correlación total.
0 r 1
r = 0.66
Este resultado indica que existe correlación, aunque mas bien pobre, es decir,
que no necesariamente, los alumnos que tengan buenas notas en lenguaje
tienen que tener buenas notas en ciencias y viceversa. Lo mismo ocurre con
los alumnos con malas notas.
Una buena correlación que nos da oportunidad de pasar al análisis de regresión, es
cuando r supera 0.80. Por supuesto, esto es una sugerencia, el analista es el que
determina el nivel de riesgo con el cual desea trabajar. La regresión es siempre
posible hacerla aunque r sea igual a valores muy bajos cercanos a cero. Lo que
sucede, en estos casos, es que las predicciones no se cumplen.
CALCULO DE r
Esta última fórmula, (de no ser necesarias las medias aritméticas de x e y), tiene la
ventaja de que solo se requieren las sumas de: x e y, sus cuadrados y sus
productos.
Agua (x) 12 18 24 30 36 42 48
Rendimiento (y) 5.27 5.68 6.25 7.21 8.02 8.71 8.42
5
12 18 24 30 36 42 48
.
En éste gráfico, resulta que x e y están relacionados en forma aproximadamente
lineal, para ésta clase de valores de x.
Por ello, una línea recta podrá ser aplicada a éste grupo de puntos para PREDECIR
los valores de y partiendo de x .
y = a + bx
Así pues:
y = 2 + 3x
e y = 4 - 2x representan:
16 y=2+3x
y=4-2x
11
1
-7 -4 -4-1 2 5 8
-9
Por ejemplo, el valor de predicción en el ejemplo visto al comienzo de este tema, para
x= 30 es, aproximadamente igual a 7.21 - 7.00 = 0.21
Si se hubiera empleado una recta diferente para la predicción, el error sería otro.
RECTA DE REGRESIÓN : y = a + bx
n xy x y
Coeficiente de regresión de la fórmula de Regresión: b
x
2
n x 2
El siguiente ejercicio sirve para realizar todos los cálculos vistos y además utilizar la
recta para hacer algunas predicciones.
X Y X2 XY Y2
65 68 4225 4420 4624
63 66 3969 4158 4356
67 68 4489 4556 4624
64 65 4096 4160 4225
68 69 4624 4692 4761
62 66 3844 4092 4356
70 68 4900 4760 4624
66 65 4356 4290 4225
68 71 4624 4828 5041
67 67 4489 4489 4489
69 68 4661 4692 4624
71 70 5041 4970 4900
r
1254.107 800811 0.7027
1253.418 8002 1254.849 8112
b
1254.107 800811 0.4764
1253.418 8002
a
811 0.4764800 35.82
12
71
70
69
68
67
66
65
62 64 66 68 70 72
Capítulo 10
10 Teoría del muestreo
3
X = 68 y X 0.6
25 n
En el siguiente gráfico podemos ver las dos distribuciones, la primera, con trazo
delgado, es la distribución de las X, la segunda, con trazo grueso, es la distribución
de las medias, en el primer caso, la desviación típica vale 3 Kg. y en el segundo
caso, vale 0.6, de acuerdo con los cálculos vistos más arriba.
Por otra parte, el tamaño de la muestra que se consulta es, n es igual a 25.
TEOREMA DOS: (Llamado del límite central) Si X posee una distribución con
promedio y desviación típica , entonces el promedio de muestra X basado en
un muestreo al azar de tamaño n, poseerá una distribución normal aproximada con
promedio y una desviación típica : , cuya aproximación se hace cada vez
mejor al crecer n
Esto es válido para variables continuas ó discretas. Veamos un ejemplo para una
variable discreta que puede tomar los valores 1 a 6 con probabilidades según el
siguiente gráfico.
Distribución No Normal
0,25
0,2
0,15
0,1
0,05
0
1 2 3 4 5 6
Esta distribución tiene una media aritmética = 2.75 y una desviación típica igual a
1.48
De esta población, supongamos de 1000 unidades, sacaremos 100 muestras, (con
reposición) de 10 unidades cada una, se obtuvo el siguiente resultado real:
20
15
10
0
1,55 1,75 1,95 2,15 2,35 2,55 2,75 2,95 3,15 3,35 3,55 3,75
X 2.75
y
1.48
x 0.47
n 10
Por lo tanto vemos que se cumple: a) una muy buena aproximación de los valores
teóricos a los prácticos, y b) que el perfil de la distribución de las medias se parece a
una normal, pese a que la distribución de las X es lo menos parecido a una normal.
X
n
a) n = 5% de N b) n = 10% de N c) n = 20% de N
Puesto que rara vez tiene objeto tomar muestras de poblaciones menores de 100, y
puesto que N - 1 diferirá de N por menos del 1%, entonces, el factor de corrección
se puede simplificar así:
5 10 20
a) 1 0.97 b) 1 0.95 c) 1 0.89
100 100 100
Como recomendación final sería: usar la fórmula original mientras que la muestra sea
menor que el 10% con respecto a N, y la fórmula corregida desde el 10% para arriba.
como : , nótese que al dividir por n entra dentro de la raíz como n al cuadrado.
Estas fórmulas son válidas para muestreo de poblaciones infinitas o con reposición.
Todos los desarrollos vistos sirven para el caso de la suma en lugar de la resta, así
para el primer caso tendríamos:
Ejercicio 1
Desarrollo:
Pero ésta será la probabilidad de que se encuentre entre los límites dados, la
pregunta lo solicita fuera de dichos límites.
Ejercicio 2
Ejercicio 3
Hallar la probabilidad de que en los próximos 200 nacimientos a) menos del 40%
sean niños, b) entre 43% y 57% sean niños, c) más del 54%
Se deberá suponer que las probabilidades de nacimiento de niño o niña serán del
50%.
= P = 0,50
Para este valor de z, la tabla nos da un área de 0,4977, por lo cual, el área
correspondiente a menos de 40 % será: 0,500 – 0,4977 = 0,0023
Respuesta: 0.23 %
Respuesta: 95,22%
c)
Respuesta: 12,92%
Ejercicio 4
Dos distancias se han medido como 27.3 cm y 15.6 cm con desviación típica de
0,16 y 0,08 cm, respectivamente. Hallar la media y la desviación típica de a) la
diferencia y b) la suma de esas distancias.
Solución:
Capítulo 8
Ejercicios 8.1, 8.2, 8.3, 8.4, 8.7, 8.11, 8.16, 8.21, 8.23, 8.24, 8.25, 8.26,
8.27, 8.34, 8.39, 8.40.
Capítulo 11
11 Intervalos de confianza
La Distribución Binomial,
N
PX p X qN X
X
queda completamente determinada por el número de intentos n, y la probabilidad de
éxito en una sola prueba p.
Una estimación por punto es lo habitual, esto es el número que se obtiene por
cálculo a partir de los valores de la muestra y que sirve como aproximación al
parámetro que se está estimando.
X 1 XN X4 X3 X2
------------------------------------I---I-----I------I-------I----------I--I--I-------------------->
I1 0 I2 eje de las X
Utilizando la Tabla Normal de Gauss, podemos construir la siguiente tabla que nos
será de utilidad para el resto de este capítulo y el siguiente:
% nivel de 99.73 99.0 98.0 96.0 95.45 95.0 90.0 80.0 68.27 50.0 38.30
confianza
z 3 2.58 2.33 2.05 2 1.96 1.645 1.28 1 0.6745 0.500
Puesto que n es 100, o sea es mayor de 30, de acuerdo con lo visto en la Teoría del
Muestreo, Capítulo 10, la distribución de las medias de muestreo, será normal.
a) 5500 - 50 5500-50
b) - 5500 50 5500+50
5500 - 50 5500 + 50
5450 5550
Estos serán los valores extremos que nos interesan, transformemos estos valores en
unidades de la variable z (es ambos lados iguales)
z=
Puesto que con una muestra, estamos infiriendo cual podría ser el valor del
parámetro poblacional, es una consecuencia lógica pensar que la diferencia entre la
conocida y la desconocida sea considerada como el Error de la Estimación.
Este error será menor, cuando mayor sea la muestra. Lo cual está en línea con todo
lo que se ha venido enseñando, cuanto mayor es la muestra, mejor y más confiable
es la respuesta de la muestra.
Si lo que queremos hacer es una estimación del error que tiene una probabilidad de
ser menor al 5%, significará que el intervalo, que comprende el interior de la curva
gaussiana, será el 95% del área de la curva normal.
5450
5500
5550
Por otra parte, si queremos que afuera del intervalo, exista 5%, como es simétrico,
será, 2,5 % a cada lado del intervalo.
Por lo tanto, si en el interior de la figura, entre ambos límites, tenemos el 95% del
área, de la mitad hacia cualquiera de los dos lados tendremos el 47.5% del área, y si
buscamos en la tablas de Gauss, para el dato más cercanos a dicho a dicho valor,
tenemos que z = 1,96
en el caso que hemos desarrollado, estos límites con 95% de confianza serán:
5461<<5539
Para el primero, 90% implica un margen de error del 10%, esto es 5% de cada lado.
Para 90% significa 45% a cada lado del cero en la distribución normal de Gauss, por
ello buscamos el z mas cercano a .4500 y encontramos que el valor de z es 1.64.
o bien:
5467<<5533
Esto último significa que, con un margen de error del 10%, o dicho de otra manera,
con una confianza del 90% podemos decir, que el desconocido valor de la media
poblacional se encuentra entre 5467 y 5533.
o bien:
5449<<5551
90% 5467<<5533
95% 5461<<5539
99% 5449<<5551
Cuando no se conoce se debe hacer una estimación con una muestra tomada al azar
del lote en estudio, esta muestra deberá ser preferentemente mayor a 30 unidades y
los cálculos deberán contener una corrección dada por la siguiente fórmula:
El valor de es el que se obtiene de la muestra mayor a 30, y el valor que figura bajo
el signo radical, es el factor que permite estimar, en función del valor hallado, cual
sería el valor del parámetro de la población.
Otra situación que se puede dar es la siguiente, la muestra es menor a 30, pero
conocemos la desviación típica de la población, en ese caso, también procedemos
igual que lo descrito, pues lo que importa es el valor de la población conocido.
Pero, cuando no conocemos la desviación típica poblacional, y la tenemos que
estimar con una muestra de 30 o menos, entonces ya no sirve la distribución
Gaussiana y la estimación vista anteriormente no es válida.
En este caso, se utiliza la llamada Distribución t, que veremos a continuación.
DISTRIBUCIÓN t de Student
Confianz
a 0,50 0,75 0,80 0,85 0,90 0,95 0,98 0,99
Error 0,50 0,25 0,20 0,15 0,10 0,05 0,02 0,01
Ejemplo 1:
Ejemplo 2:
Deseamos pronunciarnos con una confianza del 95%, es decir, con un margen de
error del 5%.
o bien:
5418<<5582
Como puede apreciarse, los límites se han abierto significativamente debido a la falta
de confianza en una muestra chica.
Pero ahora nos interesa solo p, es decir el % defectuoso, para ello dividimos las
fórmulas por el valor de n y nos queda:
Así, la fórmula para los intervalos de confianza para las proporciones o porcentajes
de defectuosos, estará dada por la siguiente expresión:
Capítulo 9
Ejercicios: 9.5, 9.6, 9.7, 9.9, 9.10, 9.11, 9.12, 9.22, 9.23, 9.24, 9.25, 9.26,
9.27, 9.28, 9.30, 9.31, 9.32, 9.33, 9.34.
Capítulo 12
12 Números Índice
12.1 Relaciones de Precios
Problema
Los precios al por menor, en centavos por libra, del cinc en Usa, durante 1978-84
son:
a) Con 1978 como base, hallar las relaciones de precios correspondientes a los
años 1982 y 1984
b) Con 1980 como base, hallar las relaciones de precios correspondientes a los años
dados:
Problema
La tabla presenta la producción de trigo en Usa de 1977 a 1985. Reducir los datos de
la tabla a relaciones de cantidad usando a) 1982 b) 1977-1980 como base:
Año 1977 1978 1979 1980 1981 1982 1983 1984 1985
Producción de trigo 2046 1776 2134 2380 2785 2765 2420 2595 2425
Año 1977 1978 1979 1980 1981 1982 1983 1984 1985
Relación 74.0 64.2 77.2 86.1 100.7 100.0 87.5 93.9 87.7
Cantidad
(1982=100)
Año 1977 1978 1979 1980 1981 1982 1983 1984 1985
Relación 98.2 85.2 102.4 114.2 133.6 132.7 116.1 124.5 116.4
Cantidad
(1977-1980=100)
Problema
En enero de 1980 una empresa pagó un total de $80.000 a 120 empleados en
nómina.
En Julio de ese mismo año, la empresa tenía 30 trabajadores más en nómina y pagó
$12.000 más que en enero.
a) Con enero de 1980 como base, hallar el número índice de empleo (la relación de
cantidad) para julio.
b) Con enero de 1980 como base, hallar el número índice (relación de valor)
trabajo - gasto para julio.
Solución:
a) El número índice de empleo es:
Este es un número índice de costo por empleado. Significa que en julio de 1980 el
costo por empleado era el 92% del de enero de 1980.
Si p1, p2, p3,... representan los precios durante intervalos sucesivos de tiempo 1, 2, 3 ...,
Entonces p1/2, p2/3, p3/4, ... representan las relaciones de precios de cada intervalo
respecto al intervalo de tiempo precedente y se llaman: Relaciones de enlace
Cuando se interpretan una a continuación de otra y se lee la variación entre un
tiempo y otro forman una Cadena que muestra la variación del precio entre dichos
dos instantes de tiempo.
Problema
Supongamos que tenemos que actualizar el monto del arriendo de un departamento
que en el mes de Diciembre fue de $100.000,
a) Se desea saber cual será, actualizado el monto en el mes de Julio del siguiente
año.
b) Cual será la variación del precio entre Abril y Junio.
La información disponible son los índices de variación de precios al consumidor (IPC)
de cada mes:
Solución:
a) En primer término se debe escribir la relación de enlace, en forma de índice, para
cada dato mensual:
Es el cociente del precio total de los artículos en el año dado, p n y el precio total de
los artículos en el año base, po. Se expresa en forma porcentual.
Problema
La tabla muestra los precios al por mayor y las producciones en Usa de leche,
mantequilla y queso para 1980, 1981, y 1985. Calcular un índice de precios al por
mayor por agregación de estos productos para el año 1985, tomando como base :
a) 1980 y b) 1980 – 1981.
Problema
Calcular un índice de precios al por mayor para el año 1985, usando 1980 como
base.
Relación de precios.
Con el fin de evitar las desventajas del método de agregación simple, asignamos un
peso al precio de cada artículo, en general la cantidad vendida durante el año base,
durante el año dado o durante algún año típico. Tales pesos indican la importancia
del artículo en cuestión. Se usan las siguientes fórmulas de pendiendo de p o y pn,
Problema
Precios (centavos por libra) Cantidad ( millones de libras)
Años 1980 1981 1985 1980 1981 1985
Leche 13,23 13,95 12,90 128500 132800 143700
Mantequilla 139,3 148,0 141,1 1145 1228 1248
Queso 156,2 167,2 162,0 2381 2664 2854
Con los datos de la tabla calcular el índice de Laspeyres para 1985 con a) 1980 b)
con 1980-1981 de base:
a)
b)
Problema
Precios (centavos por libra) Cantidad ( millones de
libras)
Años 1980 1981 1985 1980 1981 1985
Leche 13,23 13,95 12,90 128500 132800 143700
Mantequilla 139,3 148,0 141,1 1145 1228 1248
Queso 156,2 167,2 162,0 2381 2664 2854
Con los datos de la tabla calcular el índice de Paasche para 1985 con a) 1980 b)
con 1980-1981 de base:
a) Base: 1980
Aunque los ingresos de las personas pueden estar creciendo teóricamente durante
un cierto número de años, sus ingresos reales pueden estar disminuyendo debido al
costo de la vida, y por lo tanto puede estar disminuyendo su poder adquisitivo. Es
decir que con la misma plata se compra menos productos. Calculamos los ingresos
reales dividiendo los ingresos aparentes de cada año por el número índice del costo
de la vida en ese año, usando un período bases adecuado.
Ejemplo: Una persona gana en 1980 150% de lo que ganaba en 1970 significa un
crecimiento del 50%. Sien el mismo período el costo de vida creció al 200% entonces
su ingreso real son solo 150/2 = 75% de lo que era en 1970.
Problema
La tabla muestra el salario semanal medio de los trabajadores en el comercio
minorista de Usa durante 1973-1983. También contiene el índice de precios al
consumo para esos años, con 1972 como base. En términos del salario medio de
1973, determinar sus salarios reales en los años 1973-1983.
Año
1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983
Salario 96.32 102.68 108.86 114.60 121.66 130.20 138.62 147.38 158.03 163.85 171.05
Indice
de 106.2 117.9 128.7 136.1 144.9 155.9 173.5 197.0 217.4 230.7 238.1
precio
Solución:
Hallamos primero un número índice de precios al consumo con 1973 como base, dividiendo
todos los números de la fila de abajo en la tabla por 106.2, en %, Luego se divide cada salario
promedio por el correspondiente número índice para obtener los salarios reales.
Año 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983
Indice
(1973 100.0 111.0 121.2 128.2 136.4 146.8 163.4 185.5 204.7 217.2 224.2
=100)
Salario
96.32 92.50 89.82 89.39 89.19 88.69 84.83 79.45 77.20 75.44 76.29
real
El salario real a 1983 es 171.05/224.2%=76.29. Los salarios se han casi doblado, los
salarios reales han decrecido, el salario real en 1983 era 20 pesos menor que el de
1973. En síntesis, el poder adquisitivo disminuyó en 20/96.32=21%
Capítulo 19: 19.1, 19.4, 19.5, 19.7, 19.8, 19.13, 19.20, 19.39, 19.41, 19.45, 19.48,
19.49, 19.50, 19.51, 19.52, 19.53, 19.55, 19.57, 19.61, 19.62, 19.77
Capítulo 13
13 Series en el tiempo.
y día, o cualquier otra causa que pudiera deducirse como responsables de las
Existen promedios móviles para tres períodos, cinco períodos, siete, etc. Es
preferible por razones que veremos adelante utilizar promedios móviles impares
para poder representar los gráficos correctamente.
Si por necesidad se utiliza un promedio móvil par, se lo denomina no centrado.
Los promedios móviles no centrados pueden centrarse, repitiendo los
promedios de nuevo, pero utilizando la misma serie obtenida.
La siguiente tabla repite los datos pero ordenados para poder realizar los cálculos en
forma ordenada.
Ero Fro Mzo Abr Myo Jun Jul Ago Set Oct Nov Dic
1976 178.2 156.7 164.2 153.2 157.5 172.6 185.9 185.8 165.0 163.6 169.0 183.1
1977 196.6 162.8 168.6 156.9 168.2 180.2 197.9 195.9 176.0 166.4 166.3 183.9
1978 197.3 173.7 173.2 159.7 175.2 187.4 202.6 205.6 185.6 175.6 176.3 191.7
1979 209.5 186.3 183.0 169.5 178.2 186.7 202.4 204.9 180.6 179.8 177.4 188.9
1980 200.0 188.7 187.5 168.6 175.7 189.4 216.1 215.4 191.5 178.5 178.6 195.6
1981 205.2 179.6 185.4 172.4 177.7 202.7 220.2 210.2 186.9 181.4 175.6 195.6
ERO FRO MZA ABR MYO JUN JUL AGO SET OCT NOV DIC
1976 105.1 92.4 96.8 90.3 92.9 101.8 109.6 109.6 97.3 96.5 99.6 108.0
1977 111.2 92.2 95.5 88.8 95.2 102.0 112.1 110.9 99.7 94.2 94.2 104.1
1978 107.4 94.6 94.3 86.9 95.4 102.0 110.3 111.9 101.0 95.6 96.0 104.4
1979 111.9 99.5 97.7 90.5 95.1 99.7 108.1 109.4 96.4 96.0 94.7 100.9
1980 105.0 99.1 98.4 88.5 92.2 99.4 113.4 113.1 100.5 93.7 93.8 102.7
1981 107.4 94.0 97.0 90.2 93.0 106.1 115.2 110.0 97.8 94.9 91.9 102.4
Total 648.0 571.8 579.7 535.2 563.8 611.0 668.7 664.9 592.7 570.9 570.2 622.5
108.0 95.3 96.6 89.2 94.0 101.8 111.5 110.8 98.8 95.2 95.0 103.8
Media
Esta última fila son los datos buscados y representan los índices Estacionales
Capítulo 13: 18.1, 18.3, 18.6, 18.7, 18.9, 18.17, 18.18, 18.19, 18.21, 18.32, 18.36,
18.42
Capitulo 14
14 Pruebas de Hipótesis
Los casos prácticos de la toma de decisiones, se ven muchas veces ayudados por
pruebas estadísticas que nos ayudan a decidir si algo es diferente que otro, si ambos
pertenecen a una misma familia o si son estadísticamente diferentes. Estos
procedimientos estadísticos tienen la virtud de que se puede conocer el riesgo que se
tiene al tomar las diferentes decisiones.
Hipótesis nula = H0
Esta hipótesis se plantea con el propósito de probar si lo que se dice es verdad y se
plantea lo inverso como alternativa. Se dice que no es verdad lo que se quiere
demostrar. Por ejemplo, si sospechamos que una moneda es falsa y queremos
demostrarlo, partimos de la Hipótesis Nula de que la moneda es buena.
Esta Hipótesis la designaremos como H0.
Hipótesis Alternativa = H1
Todo lo que difiera de la Hipótesis Nula, se denomina Hipótesis Alternativa.
Por ejemplo, si una Hipótesis Nula, fuera p = 0,5, Hipótesis Alternativa, podría ser:
Las reglas de decisión se diseñan para que los errores de tipo I y II sean los menores
posibles, pero no es sencillo, pues cuando se minimiza unos de ellos, va en perjuicio
del otro. La única forma de minimizar los dos tipos de errores es aumentando el
tamaño de la muestra, y eso no es siempre posible.
La figura nos muestra que podemos tener 95% de confianza de que si la hipótesis
es verdadera, el valor de z para un estadístico de la muestra S, estará
comprendida entre -1.96 y +1.96. Por otra parte, si al sacar una muestra y calcular su
estadístico, y determinar su correspondiente valor de z nos da un valor fuera del
intervalo indicado, podremos concluir que dicho evento, podría suceder solo en el
5% de los casos y por ello nos veríamos inclinados a rechazar la hipótesis. Así
decimos que se rechaza a un nivel de significancia del 0.05. o que el valor de z es
significativo al nivel 0.05.
El conjunto de z fuera del rango –1.96 a +1.96 se llama región crítica de la
hipótesis, región de rechazo de la hipótesis o región de significación. El
conjunto de z en el rango interior se conoce como región de aceptación de la
hipótesis o región de no significación.
Alternativa 1
Alternativa 2
Los ejemplos fueron hechos al nivel 0.05 pero podría ser cualquier otro valor
sustituyendo el 1.96.
Por otra parte, aún cuando el estadístico de la muestra no caiga en la región crítica
no prueba que la Hipótesis nula es verdadera, simplemente, no ofrece videncia
estadística para rechazarla. La única manera de aceptarla o rechazarla con
certidumbre sería si conociéramos el verdadero valor del parámetro de la población,
pero normalmente ese valor, no lo conocemos.
Cuanto más alto sea el nivel de significancia que utilizaremos al probar una
hipótesis, mayores probabilidades habrá de rechazar una hipótesis nula que
sea verdadera, (Error Tipo I).
Si se conoce Si no se conoce
n > 30 Distribución Normal, tabla z Distribución Normal, tabla z
n ≤ 30 y la población Distribución Normal, tabla z Distribución Student, tabla t
normal o aprox. normal
Ejemplo 1
Una tienda de artículos deportivos ha iniciado una promoción especial para sus
esquís de alta montaña y piensa que la promoción deberá culminar en un cambio de
precio. Sabe que, antes de comenzar la promoción, el precio promedio, al menudeo
del esquí, era de $41,95 con = $5.36. La tienda saca una muestra en 16 de sus
detallistas y descubre que el precio promedio de los esquís, es ahora $38.95. En un
nivel de significancia de 0.02 ¿tiene motivos para pensar que el precio promedio al
menudeo ha disminuido?
= $38.95 H0 : = $41.95
n = 16 H1 : < $41.95
H0 = $41.95 ’ = $ 5.36
41.95-2,05*1.34=39.2
Ejemplo 2
= $151
n = 121
H0 = $144
’ = $ 52
H0 : = $144
H1 : > $144
144+1.28*4.73=150
Ejemplo 3
Una empresa industrial supone que la vida de sus prensas rotativas es de 14.500
horas, con una desviación típica de 2.100 horas.
De una muestra de 25 prensas la compañía obtiene una media muestral de 13.000
horas. En un nivel de significación de 0,01 ¿debe la compañía concluir que la vida
media de las prensas es menor que las 14.500 supuestas?
Capítulo 15
15 Análisis de Varianza
15.1 Distribución F
Problema
Los siguientes datos dan los rendimientos de un producto químico, obtenido de
intentar 4 catalizadores diferentes en el proceso. Probar que los rendimientos se ven
afectados por los catalizadores. Se solicita probar con una probabilidad de
equivocarse del 5%, que los catalizadores afectan al rendimiento, por ello partiremos
Cálculo de F:
Cálculo de las varianzas por columnas: (variabilidad
dentro de las columnas, dentro del tratamiento)
Distribuciones de F 1%
1% 1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 40 100
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 6143 6170 6209 6286 6334
2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,41 99,42 99,43 99,44 99,45 99,48 99,49
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,13 27,05 26,92 26,83 26,69 26,41 26,24
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37 14,25 14,15 14,02 13,75 13,58
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89 9,77 9,68 9,55 9,29 9,13
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72 7,60 7,52 7,40 7,14 6,99
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47 6,36 6,28 6,16 5,91 5,75
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,73 5,67 5,56 5,48 5,36 5,12 4,96
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11 5,01 4,92 4,81 4,57 4,41
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,77 4,71 4,60 4,52 4,41 4,17 4,01
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40 4,29 4,21 4,10 3,86 3,71
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16 4,05 3,97 3,86 3,62 3,47
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96 3,86 3,78 3,66 3,43 3,27
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80 3,70 3,62 3,51 3,27 3,11
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67 3,56 3,49 3,37 3,13 2,98
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,62 3,55 3,45 3,37 3,26 3,02 2,86
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46 3,35 3,27 3,16 2,92 2,76
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,43 3,37 3,27 3,19 3,08 2,84 2,68
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30 3,19 3,12 3,00 2,76 2,60
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,29 3,23 3,13 3,05 2,94 2,69 2,54
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,24 3,17 3,07 2,99 2,88 2,64 2,48
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,18 3,12 3,02 2,94 2,83 2,58 2,42
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,14 3,07 2,97 2,89 2,78 2,54 2,37
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,09 3,03 2,93 2,85 2,74 2,49 2,33
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 3,06 2,99 2,89 2,81 2,70 2,45 2,29
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 3,02 2,96 2,86 2,78 2,66 2,42 2,25
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,99 2,93 2,82 2,75 2,63 2,38 2,22
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,96 2,90 2,79 2,72 2,60 2,35 2,19
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,93 2,87 2,77 2,69 2,57 2,33 2,16
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,91 2,84 2,74 2,66 2,55 2,30 2,13
31 7,53 5,36 4,48 3,99 3,67 3,45 3,28 3,15 3,04 2,96 2,88 2,82 2,72 2,64 2,52 2,27 2,11
32 7,50 5,34 4,46 3,97 3,65 3,43 3,26 3,13 3,02 2,93 2,86 2,80 2,70 2,62 2,50 2,25 2,08
33 7,47 5,31 4,44 3,95 3,63 3,41 3,24 3,11 3,00 2,91 2,84 2,78 2,68 2,60 2,48 2,23 2,06
34 7,44 5,29 4,42 3,93 3,61 3,39 3,22 3,09 2,98 2,89 2,82 2,76 2,66 2,58 2,46 2,21 2,04
35 7,42 5,27 4,40 3,91 3,59 3,37 3,20 3,07 2,96 2,88 2,80 2,74 2,64 2,56 2,44 2,19 2,02
36 7,40 5,25 4,38 3,89 3,57 3,35 3,18 3,05 2,95 2,86 2,79 2,72 2,62 2,54 2,43 2,18 2,00
37 7,37 5,23 4,36 3,87 3,56 3,33 3,17 3,04 2,93 2,84 2,77 2,71 2,61 2,53 2,41 2,16 1,98
38 7,35 5,21 4,34 3,86 3,54 3,32 3,15 3,02 2,92 2,83 2,75 2,69 2,59 2,51 2,40 2,14 1,97
39 7,33 5,19 4,33 3,84 3,53 3,30 3,14 3,01 2,90 2,81 2,74 2,68 2,58 2,50 2,38 2,13 1,95
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66 2,56 2,48 2,37 2,11 1,94
41 7,30 5,16 4,30 3,81 3,50 3,28 3,11 2,98 2,87 2,79 2,71 2,65 2,55 2,47 2,36 2,10 1,92
42 7,28 5,15 4,29 3,80 3,49 3,27 3,10 2,97 2,86 2,78 2,70 2,64 2,54 2,46 2,34 2,09 1,91
43 7,26 5,14 4,27 3,79 3,48 3,25 3,09 2,96 2,85 2,76 2,69 2,63 2,53 2,45 2,33 2,08 1,90
44 7,25 5,12 4,26 3,78 3,47 3,24 3,08 2,95 2,84 2,75 2,68 2,62 2,52 2,44 2,32 2,07 1,89
Distribuciones de F 5%
5% 1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 40 100
1 161 199 216 225 230 234 237 239 241 242 243 244 245 246 248 251 253
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,42 19,43 19,45 19,47 19,49
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,71 8,69 8,66 8,59 8,55
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91 5,87 5,84 5,80 5,72 5,66
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,64 4,60 4,56 4,46 4,41
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,96 3,92 3,87 3,77 3,71
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57 3,53 3,49 3,44 3,34 3,27
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,24 3,20 3,15 3,04 2,97
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,03 2,99 2,94 2,83 2,76
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,86 2,83 2,77 2,66 2,59
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,74 2,70 2,65 2,53 2,46
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,64 2,60 2,54 2,43 2,35
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,55 2,51 2,46 2,34 2,26
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53 2,48 2,44 2,39 2,27 2,19
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,42 2,38 2,33 2,20 2,12
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42 2,37 2,33 2,28 2,15 2,07
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,33 2,29 2,23 2,10 2,02
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,29 2,25 2,19 2,06 1,98
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,26 2,21 2,16 2,03 1,94
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,22 2,18 2,12 1,99 1,91
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25 2,20 2,16 2,10 1,96 1,88
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23 2,17 2,13 2,07 1,94 1,85
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20 2,15 2,11 2,05 1,91 1,82
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18 2,13 2,09 2,03 1,89 1,80
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16 2,11 2,07 2,01 1,87 1,78
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15 2,09 2,05 1,99 1,85 1,76
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13 2,08 2,04 1,97 1,84 1,74
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 2,06 2,02 1,96 1,82 1,73
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10 2,05 2,01 1,94 1,81 1,71
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09 2,04 1,99 1,93 1,79 1,70
31 4,16 3,30 2,91 2,68 2,52 2,41 2,32 2,25 2,20 2,15 2,11 2,08 2,03 1,98 1,92 1,78 1,68
32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14 2,10 2,07 2,01 1,97 1,91 1,77 1,67
33 4,14 3,28 2,89 2,66 2,50 2,39 2,30 2,23 2,18 2,13 2,09 2,06 2,00 1,96 1,90 1,76 1,66
34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12 2,08 2,05 1,99 1,95 1,89 1,75 1,65
35 4,12 3,27 2,87 2,64 2,49 2,37 2,29 2,22 2,16 2,11 2,07 2,04 1,99 1,94 1,88 1,74 1,63
36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15 2,11 2,07 2,03 1,98 1,93 1,87 1,73 1,62
37 4,11 3,25 2,86 2,63 2,47 2,36 2,27 2,20 2,14 2,10 2,06 2,02 1,97 1,93 1,86 1,72 1,62
38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 2,05 2,02 1,96 1,92 1,85 1,71 1,61
39 4,09 3,24 2,85 2,61 2,46 2,34 2,26 2,19 2,13 2,08 2,04 2,01 1,95 1,91 1,85 1,70 1,60
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00 1,95 1,90 1,84 1,69 1,59
41 4,08 3,23 2,83 2,60 2,44 2,33 2,24 2,17 2,12 2,07 2,03 2,00 1,94 1,90 1,83 1,69 1,58
42 4,07 3,22 2,83 2,59 2,44 2,32 2,24 2,17 2,11 2,06 2,03 1,99 1,94 1,89 1,83 1,68 1,57