Está en la página 1de 155

Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Curso de Estadística

Dirigido a:

Estudiantes de Carreras Técnicas e Ingenierías

De Institutos Profesionales

Edición revisada

Marzo del 2006

Autor:

Profesor Edgardo Ojeda Barcos

Licenciado en Organización de la Producción,


Universidad Argentina de la Empresa.

Postítulo en Ingeniería de Calidad,


Universidad de Santiago de Chile.

Derechos de autor en trámite

Derechos de autor en trámite Página 1 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

ÍNDICE

Capítulo 1
1.1 Introducción al concepto de Estadística
1.2 Gráficos

Capítulo 2
2.1 Distribuciones de frecuencias, Histogramas
2.2 Distribución de frecuencias acumuladas y ojivas.
2.3 Ejercicios de aplicación

Capítulo 3
3 Promedios
3.1 Media Aritmética
3.2 Media Aritmética Ponderada
3.3 Propiedades de la Media Aritmética
3.4 Cálculo de la Media Aritmética para datos agrupados
3.5 Ejercicios de aplicación.
3.6 La Mediana
3.7 La Moda
3.8 Relación empírica entre la media aritmética, la mediana y la
moda

Capítulo 4
4 Medidas de la dispersión de una distribución de datos
4.1 Dispersión o variación
4.2 Rango o Intervalo
4.3 La Desviación Típica
4.4 Desarrollo de tres fórmula para el cálculo de la Desviación
Típica
4.5 Propiedades de la desviación Típica
4.6 Varianza
4.7 Desviación Media
4.8 Ejercicios en clase.
4.9 Ejercicios de Aplicación

Capítulo 5
5 CuantilosCuantilos
5.1 Definición
5.2 Medidores de Tendencia Central
5.3 Medidores de la Dispersión
5.4 Procedimiento de Cálculo
5.5 Procedimiento de Calculo para datos Agrupados
5.6 Obtención de los valores correspondientes cuando el
número de datos es distinto de 100
5.7 Ejercicios en clase.
5.8 Ejercicios de aplicación.

Capítulo 6
6 Teoría elemental de Probabilidades

Derechos de autor en trámite Página 2 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

6.1 Definición de Probabilidad


6.1.1 Definición Clásica
6.1.2 Definición como Frecuencia Relativa
6.2 Concepto de Probabilidad
6.3 Regla de la adición de Probabilidades
6.4 Regla del producto de las probabilidades
6.5 Aplicación de ambas reglas
6.6 Probabilidades con y sin reposición
6.7 Probabilidad de las causas. Formula de Bayes – Laplace
6.8 Ejercicios de aplicación.

Capítulo 7
7 Análisis Combinatorio y Probabilidades
7.1 Principio fundamental del análisis combinatorio
7.2 Factorial de n
7.3 Permutaciones
7.4 Combinaciones
7.5 Probabilidades y Análisis Combinatorio
7.6 Generalización del número combinatorio y probabilidades
7.7 Ejercicios de aplicación

Capítulo 8
8 Las Distribuciones Binomial, Poisson y Normal
8.1 La Distribución Binomial
8.2 Distribución de Poisson
8.3 Relación entre la Distribución Binomial y la Distribución de
Poisson
8.4 La Distribución Normal, Curva Normal o Distribución
Gaussiana.
8.5 Relación entre la Distribución Binomial y la Normal
8.6 Ejercicios de comprensión sobre la Distribución Normal
8.7 Distribución Hipergeométrica.
8.8 Aproximación Normal a Binomial
8.98 Ejercicios de aplicación.

Capítulo 9
9 Correlación y Regresión
9.1 Introducción
9.2 Análisis de Correlación
9.3 Análisis de Regresión
9.4 Ejercicios de Aplicación

Capítulo 10
10 Teoría del muestreo.
10.1 Muestreo aleatorio.
10.2 Distribución de muestreo.
10.3 Muestreo de poblaciones pequeñas.

Derechos de autor en trámite Página 3 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 11
11 Estimación
11.1 Estimación por punto y por intervalo
11.2 Intervalo de confianza
11.3 Estimación de la media aritmética.
11.4 Margen de error y coeficiente de confianza.
11.5 No siempre se conoce el valor de la desviación típica
poblacional.
11.6 Distribución t, o Distribución de Student.
11.7 Intervalos de confianza para las proporciones o porcentajes
de defectuosos.

Capítulo 12
12 Números Índices.
12.1 Relaciones de precios.
12.2 Relaciones de Cantidad o de Volumen
12.3 Relaciones de valor
12.4 Relaciones de Enlace y en Cadena.
12.5 El método de agregación simple.
12.6 El método de agregación Simple de relaciones.
12.7 El método de agregación ponderada.
12.7.1 Indice de Laspeyres.
12.7.2 Indice de Paasche.
12.8 Deflación de series en el tiempo.

Capitulo 13
13 Series de Tiempo
13.1 Análisis de series en el tiempo
13.2 Estimación de las variaciones estacionales. El Índice
Estacional
13.3 Ejercicios de Aplicación

Capitulo 14
14 Pruebas de Hipótesis
14.1 Hipótesis Estadísticas.
14.2 Contrastes de Hipótesis y significación, o reglas de
decisión.
14.3 Errores de Tipo I y de Tipo II .
14.4 Nivel de significación.
14.5 Contrastes mediante la distribución normal.
14.6 Tres distintos niveles de significancia.
14.7 Selección de un nivel de significancia.
14.8 Uso de la distribución t para la toma de decisiones.
14.9 Ejercicios de aplicación desarrollados.
14.10 Ejercicios de Aplicación.

Derechos de autor en trámite Página 4 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capitulo 15
15 Análisis de Varianza
15.1 Distribución F
15.2 Análisis de Varianza y Cálculo de F, con una variable de
clasificación.

Bibliografía

Derechos de autor en trámite Página 5 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Prólogo a la edición de Marzo de 2006.


A mis queridos alumnos.

El presente trabajo, tiene una finalidad claramente establecida, facilitar el estudio y


la comprensión de la materia Estadística, a los estudiantes de Ingeniería y de
carreras técnicas.

El libro no tiene pretensiones de originalidad, por ello, y sin querer amenguar el


mérito que tienen las variadas partes, que sí, son originales, el libro es una
compilación de diversos autores y libros de estudio que actualmente están vigentes.
Todas las fuentes que han sido consultadas, están catalogadas, al final del estudio.
Por otra parte, en el contenido del libro, se han volcado todas las dudas y consultas
frecuentes y que han sido recolectadas a lo largo de innumerables cursos realizados
por el autor.
Este libro, no pretende reemplazar la asistencia a clase, lo cual ha sido debidamente
contemplado, es decir, la asistencia a clase sigue siendo indispensable para la
correcta aprehensión de la materia. Tampoco se desea limitar a los alumnos a la
exclusiva lectura de éste estudio, ya que un alumno de nivel terciario, tiene
necesariamente que aprender a consultar distintas fuentes de información.
A lo largo de sucesivas revisiones se han ido incorporando temas de interés para las
distintas carreras , como Ingeniería Química, Alimentos, Prevención de Riesgos, de
la Madera, etc, por lo cual, el libro se transforma en una herramienta de consulta para
las distintas carreras de Institutos profesionales.
Por último, una recomendación muy útil, si bien este consejo es válido para cualquier
disciplina, en el estudio de la estadística, es particularmente importante. Para ser
exitosos en el aprendizaje de la estadística se requiere ser persistente, tanto en la
asistencia a clase como en la continuidad del estudio. La estadística es una cadena
interminable que se va construyendo con un conocimiento arriba de otro; una clase
que se pierde, un concepto que no se entiende, crea grandes lagunas difíciles de
superar. Por esto recomiendo: a) asistir a todas las clases, b) llegar a cada clase con
una comprensión suficiente de los conceptos vistos anteriormente para poder
entender y participar en el desarrollo siguiente.

El objetivo de todo futuro profesional es: APRENDER.

Edgardo Ojeda Barcos


Profesor de Estadística y Control de Calidad

Santiago de Chile.
Marzo de 2006.

Derechos de autor en trámite Página 6 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 1
1.1 Introducción al concepto de la Estadística

La palabra estadística es un concepto muy conocido y por cierto muy amplio.


Podríamos decir que la estadística tiene que ver con la recopilación y comprensión de
datos numéricos.
Sin embargo, para comprender mejor el campo de la Estadística nos referiremos a un
ejemplo y dejaremos al estudiante la generalización de dicho ejemplo.

Supongamos que por necesidades académicas necesitamos conocer la edad


promedio de todos los alumnos del Inacap en todo el país. La forma perfecta de
hacerlo sería consultar a los miles de alumnos a lo largo del país, y luego de una
larga, tediosa y cara tarea, sumaríamos todas las edades, las dividiríamos por el total
de alumnos y obtendríamos el dato buscado.

Sin embargo, la Estadística nos ofrece un camino, más corto, más rápido y
conveniente para obtener la información, suficientemente válida y muy cercana al
dato anterior.

Imaginemos que tenemos un gran recipiente donde colocáramos tantas fichas como
alumnos y cada ficha tuviera el dato de la edad de cada alumno. Ese gran recipiente
sería nuestro Universo o Población.

Alguien con sentido común propondría tomar algunas fichas al azar y calcular el
promedio de dicho pequeño grupo de unidades. Intuitivamente podremos aceptar
que el dato obtenido no necesariamente será el valor verdadero del total de las
fichas, pero sin duda guardará cierta relación y además será la mejor información
disponible.

DEFINICION DE ESTADISTICA

Generalizando, podremos decir que la Estadística es la metodología científica


que se encarga de INFERIR los valores de los parámetros de la Población o
Universo mediante la extracción sistemática de MUESTRAS.

Estas técnicas pueden además, darnos información acerca de la confiabilidad,


(certeza) con que los datos son obtenidos.

En los trabajos estadísticos podemos distinguir dos áreas de trabajo, la primera se


llama Estadística descriptiva, y es la que se encarga de la recopilación, el
ordenamiento e interpretación de la información o datos.

La segunda área, es la llamada Estadística Inductiva o Inferencia Estadística, es


decir la que por elaboración de los datos anteriores, nos ofrecen respuestas a los
interrogantes planteados unidos a información probabilística acerca de la
confiabilidad de dicha información.

Derechos de autor en trámite Página 7 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

1.2 Gráficos

La estadística encuentra en los gráficos, una herramienta indispensable para


ayudar a entender, interpretar y comunicar sus conclusiones.
En éste estudio, solo veremos algunos de ellos. El primero será las llamadas Series
de Tiempo.

Crecimiento Demográfico en EE.UU. ( en millones de personas)

Año 1860 70 80 90 1900 10 20 30 40 50 60 70 80


Población 31 40 50 63 76 92 106 123 132 151 179 203 227

La misma información puede representarse como un gráfico o diagrama de barras.

Derechos de autor en trámite Página 8 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Otros Gráficos

Datos de producción de una región hipotética:

Año Tn trigo Tn maíz Total Porcentual


trigo
75 200 75 275 73 %
76 185 90 275 67 %
77 225 100 325 69 %
78 250 85 335 75 %
79 240 80 320 75 %
80 195 100 295 66 %
81 210 110 320 66 %
82 225 105 330 68 %

Gráfico de trazos

Derechos de autor en trámite Página 9 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Gráfico de Barras

Gráfico de Barras Acumuladas

Derechos de autor en trámite Página 10 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Gráfico de Barras Porcentuales

Gráfico de barras horizontales

Derechos de autor en trámite Página 11 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Gráfico circular abierto.

1.3 Ejercicios de Aplicación.

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico.

1.3, 1.4, 1.5, 1.6, 1.8, 1.9, 1.10, 1.16, 1.17, 1.18, 1.19, 1.20, 1.21, 1.22, 1.23, 1.24,
1.23, 1.27, 1.29, 1.30, 1.48, 1.52, 1.59, 1.71, 1.76.

Derechos de autor en trámite Página 12 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 2
2.1 Distribuciones de frecuencias, Histogramas

Cuando se realiza una recolección de datos muy extensa, por ejemplo, 50 o más
datos, resulta muy difícil interpretar la información recibida.
Una primera investigación que podríamos realizar, sería la de encontrar el mayor
valor y el menor de ellos lo cual nos informaría acerca del INTERVALO el cual se
encuentran todos los datos.
Lo segundo podría ser ordenarlos de menor a mayor, pero aun seguiría siendo una
larga lista de números.
El siguiente procedimiento, nos permitirá ordenarlos e interpretar valiosa información
estadística.
Este ordenamiento consiste en crear CLASES, dentro de las cuales clasificaremos
los datos. El procedimiento es dividir la distancia del INTERVALO en intervalos más
cortos que llamaremos clases. La pregunta que nos haremos es: ¿en cuantas clases
dividiremos el INTERVALO?
Existe una regla empírica, (práctica) que dice lo siguiente:
Si el total de datos es n, el número de clases que buscamos será n
Para entenderlo mejor, haremos un ejemplo.
Supongamos que se han tomado 84 datos de una medida de diámetros de ejes para
un instrumento de precisión.
Los datos tal como se obtuvieron son:

881 880 905 933 872 861 882 877 890 898 863 896 878 906
886 875 890 928 911 955 893 867 920 879 899 897 870 883
885 883 889 874 878 904 939 901 894 859 886 865 902 867
889 874 891 925 866 869 868 894 891 901 912 892 921 895
910 915 846 892 885 866 910 885 916 915 923 857 891 889
912 907 881 893 905 924 876 903 887 901 888 907 880 882

En total son 84 mediciones, por lo tanto n = 84

El mayor valor es 955


El valor mínimo es 846

El INTERVALO es 109

Derechos de autor en trámite Página 13 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

De acuerdo con la regla empírica, descrita anteriormente, el número de CLASES que


deberemos hacer será 84  9.17 , este número debe aproximarse al valor entero,
es decir 9.
El paso siguiente será, dividir el INTERVALO, 109, por el dato hallado,
109 / 9 = 12.1
Nuevamente deberemos tomar el número entero, es decir 12.
El número 12 es par, existen razones que veremos mas adelante para preferir que
este número sea impar, por lo tanto elegiremos 11, ¿podría servir 13? La respuesta
es sí, pues éste es un procedimiento aproximado.
Este valor es denominado: ANCHO DE CLASE.
Bien, este ANCHO DE CLASE: 11, nos servirá para construir nuestras CLASES.
¿Por cual número comenzaremos?

Es costumbre comenzar exactamente por el menor de los datos encontrados, es


decir 846, pero podríamos empezar por algún otro número, algo menor por ejemplo
840 y el resultado obtenido sería igualmente válido.
Para nuestro ejemplo comenzaremos con el mínimo leído, esto es 846 y lo
utilizaremos como LÍMITE INFERIOR DE LA CLASE 1.
Para hallar el LÍMITE DE LA CLASE 2, sumaremos 11 a 846, es decir que el límite
de la clase 2 es: 857, y el de la clase 3 será 868.
Nos queda ahora, determinar el LÍMITE SUPERIOR DE LA CLASE 1 y
subsiguientes.
El LÍMITE SUPERIOR DE LA CLASE 1 será una unidad significativa menor que el
límite inferior de la clase 2, es decir: 856 y el límite superior de la clase 2 será: 867.
De esta forma las clases serán:
CLASES LIMITE INFERIOR LIMITE SUPERIOR
1 846 856
2 857 867
3 868 878
4 879 889
5 890 900
6 901 911
7 912 922
8 923 933
9 934 944
10 945 955

En este paso debemos preguntarnos, ¿porqué son 10 las clases, si habíamos


calculado 9?. Porque descartamos el 12 y preferimos el número impar (11),
Ahora tenemos que determinar con qué FRECUENCIA caen los datos dentro de
estas celdas llamadas CLASES.

Derechos de autor en trámite Página 14 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Para ello procederemos a marcar con un pequeño trazo vertical, cada dato dentro de
su clase, Por ejemplo, los números 881 y 880, pertenecen a la clase 4 y el número
905 a la clase 6. De esta forma se registran los 84 datos.
Así se construye la siguiente tabla:

CLASES LÍMITE LÍMITE DIAGRAMA FRECUENCIA


INFERIOR SUPERIOR DE TILDES DE CLASE
1 846 856 / 1
2 857 867 //// //// 9
3 868 878 //// //// / 11
4 879 889 //// //// //// //// 19
5 890 900 //// //// //// / 16
6 901 911 //// //// //// 14
7 912 922 //// // 7
8 923 933 //// 5
9 934 944 / 1
10 945 955 / 1
TOTAL 84 84

Este perfil obtenido con el diagrama de frecuencias ya nos está dando valiosa
información estadística, vemos que los datos están concentrados con preferencia
alrededor de la CLASE 4 y que un valor representativo del grupo debería estar
dentro de esa clase.

Para terminar con el estudio de los diagramas de frecuencia, veremos algunas


características más que serán necesarias en cálculos futuros:

ANCHO DE CLASE, en nuestro ejemplo es 11, y se obtiene como diferencia entre el


límite inferior de una clase y el límite inferior de la clase inmediatamente anterior.
MARCA DE CLASE, es el promedio entre los límites superior e inferior de una clase
determinada. Por ejemplo, para la clase 1 de nuestro ejemplo, tenemos:

Limite inferior de la clase: 846


Limite superior de la clase: 856

Promedio: (846+856)/2 = 851

Por lo tanto, la MARCA DE CLASE del grupo 1 será 851.En éste punto recordaremos
que al principio de éstos cálculos mencionamos que era conveniente utilizar un
número impar. Ahora explicaremos el porqué de esa recomendación.

Derechos de autor en trámite Página 15 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Si el numero no hubiera sido impar, la MARCA DE CLASE, no hubiera sido un


número exacto, hubiera tenido un valor decimal que habría que mantener,
necesariamente, y esto trae aparejado, un aumento de las posibilidades de error en
los cálculos.
Sin embargo, si pese a la recomendación de usar impar, prefirió un número par, no
habrá error si mantiene durante todos los cálculos, el valor decimal que se genera
por dicha causa.
En nuestro caso, no hay decimales, la marca de clase de la clase uno dio 851
exacto. Luego sumamos el ancho de clase, 11, para hallar las marcas de
clases sucesivas.
CLASES LÍMITE LÍMITE MARCA DE FRECUENCIA
CLASE
INFERIOR SUPERIOR DE CLASE
1 846 856 851 1
2 857 867 862 9
3 868 878 873 11
4 879 889 884 19
5 890 900 895 16
6 901 911 906 14
7 912 922 917 7
8 923 933 928 5
9 934 944 939 1
10 945 955 950 1
TOTAL 84

Es recomendable, calcular primero la frecuencia y después la marca de clase para


que esta columna no interfiera durante la clasificación de los datos.

DISTRIBUCIÓN DE FRECUENCIA:

Se denomina Distribución de Frecuencia, al resultado de la marca de clase, que


posteriormente será la variable X y la frecuencia que corresponde para cada valor de
la marca de clase.

Derechos de autor en trámite Página 16 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Distribución de Frecuencia:

MARCA DE FRECUENCIA
CLASE (X)
DE CLASE
851 1
862 9
873 11
884 19
895 16
906 14
917 7
928 5
939 1
950 1
84

HISTOGRAMA

Con los datos de la distribución de frecuencias se procede a construir el histograma.

FRONTERA DE CLASE:

Derechos de autor en trámite Página 17 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

La FRONTERA DE CLASE , es un punto en la Clasificación de clases intercalado


entre las marcas de manera que no caiga en ninguna de las dos clases contiguas.
Esto se logra promediando el Límite Superior de una clase con el Límite Inferior de la
siguiente, y tomando un decimal más que la última cifra significativa, según los datos
que se estudian.

En nuestro ejemplo, la FRONTERA DE CLASE entre la 1º y 2º clase será: 856,5


Luego entre la 3º y 4º será : 878.5

La siguiente tabla resumen figuran todos los datos estudiados:

CLASES L. I. L. S. MARCA FRONTERAS FRECUENCIA


1 846 856 851 845.5 1
2 857 867 862 856.5 9
3 868 878 873 867.5 11
4 879 889 884 878.5 19
5 890 900 895 889.5 16
6 901 911 906 900.5 14
7 912 922 917 911.5 7
8 923 933 928 922.5 5
9 934 944 939 933.5 1
10 945 955 950 944.5 1
Total 84

Para terminar de interpretar los HISTOGRAMAS, el alumno puede imaginar que los
valores de las fronteras de clases, están exactamente en las líneas que separan
cada uno de los bloques del HISTOGRAMA.
2.2 Distribuciones de Frecuencias Acumuladas y Ojivas

La frecuencia total de todos los valores menores que la frontera de clase superior de
un intervalo de clase dado se llama FRECUENCIA ACUMULADA hasta ese intervalo
de clase inclusive.
Una tabla que presente tales frecuencias acumuladas se denomina una
DISTRIBUCIÓN ACUMULADA.

Derechos de autor en trámite Página 18 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Un gráfico que represente las frecuencias acumuladas por debajo de cualquiera de


las fronteras de clase superiores respecto de dicha frontera se llama un POLÍGONO
DE FRECUENCIAS ACUMULADAS U OJIVA

A continuación, desarrollaremos un ejemplo, la altura de 100 estudiantes de una


universidad XYZ, este ejemplo fue tomado del libro “Estadística” de Murray R,
Spiegel y lo utilizaremos para varios desarrollos como el que sigue:

Altura en metros. Marca Frecuencias F. Acumulada F. relativa


1.51 - 1.59 1.55 5 5 5
1.60 - 1.68 1.64 18 23 18
1.69 - 1.77 1.73 42 65 42
1.78 - 1.86 1.82 27 92 27
1.87 - 1.95 1.91 8 100 8
Total 100 100

Nota: la frecuencia relativa coincide con las frecuencias, simplemente por n=100, si n
es cualquier otro valor, ambas columnas, no coincidirán.

Otros detalles son

Limite inferior Limite Superior Frontera Ancho de Clase


...... ...... 1.505
1.51 1.59 1.595 .09
1.60 1.68 1.685 .09
1.69 1.77 1.775 .09
1.78 1.86 1.865 .09
1.87 1.95 1.955 .09

El siguiente gráfico explica lo anterior:

2.3 Ejercicios de Aplicación.

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico.

Derechos de autor en trámite Página 19 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 2:

Para resolver estos problemas, el alumno deberá usar los métodos y criterios
vistos en clase, los cuales difieren de los usados en el libro.

Distribución de frecuencias: 2.2, 2.3, 2.6, 2.7, 2.20, 2.21, 2.23, 2.26, 2.27, 2.28,
2.29.

Derechos de autor en trámite Página 20 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 3
3 Promedios

La palabra PROMEDIO, es una palabra genérica, es decir, existen varios tipos de


PROMEDIOS.
Los PROMEDIOS que estudiaremos son : MEDIA, MEDIANA, MODA, MEDIA
GEOMÉTRICA Y MEDIA ARMÓNICA.
Los promedios tienen en común que buscan el valor central de los datos estudiados.
Por esta razón se los denomina: MEDIDORES DE LA TENDENCIA CENTRAL.

3.1 Media Aritmética

Para definir la Media Aritmética, primero describiremos algunos conceptos básicos:

NOTACIÓN DE ÍNDICES: Si tenemos un universo de N datos, Xj será cualquiera


de los N datos.

valores., esto es: X1, X 2 ,..., XN

N
NOTACIÓN DE SUMA: X
J 1
J  X1  X 2  ... XN

UNIVERSO o POBLACIÓN: Son todos los valores o datos que existen.


MUESTRA: Es un parte tomada al azar de la POBLACIÓN, y que son
representativos de la POBLACIÓN.
DEFINICIÓN DE LA MEDIA ARITMÉTICA: Es la suma de todos los valores de la
POBLACIÓN o de la MUESTRA, dividido por el numero total de los datos
considerados.

MEDIA ARITMÉTICA =

Muy frecuentemente, uno o varios datos de los registrados se repiten, es dicho caso
la fórmula anterior de interpreta de la siguiente manera:
Si los datos : X1 , X 2 ,..., XN se repiten con frecuencia f1 , f2 ,..., fk veces,
entonces la MEDIA ARITMÉTICA se define de la siguiente forma:
k

f . X  f . X  ... fk . Xk
fX
j 1
j j

X 1 1 2 2  k
f1  f2  ... fk
f
j1
j

El siguiente ejemplo aclarará el concepto:


Si los datos: 5, 8, 6, y 2 ocurren con frecuencias 3, 2, 4, y 1

Derechos de autor en trámite Página 21 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

3 * 5  2 * 8  4 * 6  1* 2
X  5.7
3 2 41

Con respecto a los índices utilizados en las fórmulas de las medias, el estudiante
habrá notado que en la primera fórmula, el subíndice utilizado, es N, esto es el total
de unidades consideradas y en el segundo caso, cuando hay repetición de algunos
datos, el subíndice utilizado es k.

En éste último caso k es el numero de datos distintos, sin repetición, de ésta manera,
la sumatoria de las frecuencias será igual a N

El siguiente ejemplo, aclara lo que hemos dicho:

Datos Frecuencia
3 2
4 1
5 3
8 5
9 3

Es decir, tenemos 2 datos 3, 1 dato 4, 3 datos 5, etc.

El total de datos es 3*2+4*1+5*3+8*5+9*3 = 92, N = 92 , pero los datos diferentes


entre si son solo 5, por ello es k = 5

3.2 Media Aritmética Ponderada: esta variante de la media aritmética, se usa


cuando se hace necesario dar distinto “peso” a cada dato. Esto significa, asociar con
los datos en estudio, con factores o “pesos” : W1, W2 ,..., WK

De esta forma, la MEDIA ARITMÉTICA PONDERADA es:

Un ejemplo típico de esto es la ponderación de las notas de los parciales y los


exámenes finales en INACAP. El reglamento indica que la nota final (PROMEDIO
PONDERADO), estará formado por el 7560% del promedio de notas de los parciales
y el 2540% de la nota final. Si un alumno tiene promedio 6.5 en los parciales y 4,9 en
el final la nota será:

MEDIA ARITMÉTICA PONDERADA =

Derechos de autor en trámite Página 22 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Nótese que la MEDIA ARITMÉTICA (no ponderada) es 5,7

3.3 Propiedades de la Media Aritmética.

Propiedad Nº 1

La suma algebraica de las desviaciones de un conjunto de números respecto de su


media aritmética es cero.

Ejemplo:

Las desviaciones de los números: 8, 4, 3, 11, 7 y 6 respecto de su MEDIA


ARITMÉTICA cuyo valor es : 6.5 son:

Datos menos Media igual Desviación


Aritmética
8 - 6.5 = +1.5
4 - 6.5 = -2.5
3 - 6.5 = -3.5
11 - 6.5 = +4.5
7 - 6.5 = +0.5
6 - 6.5 = -0.5

total: +0.00

Probar genéricamente que la suma de las desviaciones de X1, X2, ... Xn respecto de
su MEDIA ARITMÉTICA es cero

Las desviaciones con respecto a la media se denotan de la siguiente manera:


d1  X1  X
d2  X2  X
... ... ... ...
dN  XN  X

Entonces:

n n

 dj 
j 1
 X
j 1
J 
X   X  X    X   X 

 X  NX   X  
N X
 X X  0
N

Derechos de autor en trámite Página 23 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Con esto queda demostrada la propiedad.

Propiedad nº 2

La suma de los cuadrados de las desviaciones de un conjunto de números Xj


respecto de un cierto número a es mínima, si y solo si, a = Media Aritmética.

 (X
j1
j  a)2 minimo

si y solo si a= X

Esta propiedad la podemos comprobar usando los datos que se dieron en el ejemplo
de la propiedad nº 1

Si a es 6,5 o sea la media aritmética el resultado de la sumatoria de los cuadrados es


: 41.50

Si a fuera 6 el resultado de dicha suma es 43,00

Se sugiere al alumno calcular el resultado para a = 8

Esta propiedad es conceptualmente importante para futuros desarrollos.

Propiedad nº 3

Si n1 números tienen media m1, y n2 números tienen media m2, y ..., nk números
tienen media mk , entonces la media de todos los números es:

n1m1  n2m2  ... nkmk


X
n1  n2  ... nk

Veamos un ejemplo:

Los 90 empleados de la sucursal A de una Empresa ganan en promedio $ 230.000, y


los 75 empleados de la sucursal B ganan en promedio $ 325.000. ¿Cual es el
promedio de sueldos de las dos sucursales?

X
 nm  90 * 230.000  75 * 325000  273.182
n 90  75

Propiedad nº 4

Derechos de autor en trámite Página 24 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Esta propiedad parte de la suposición de que empezamos los cálculos suponiendo o


estimando cual podría ser el valor de la MEDIA ARITMÉTICA, técnicamente esto
significa que estamos conjeturando la media.

La propiedad se enuncia de la siguiente manera:

Si A es una MEDIA SUPUESTA O CONJETURADA y si dj = xj - A son las


desviaciones de xj respecto de A, tenemos que:

Para datos sin repetición:

X A+
d
N

Para datos con repetición:

X A+
 fd
N

Donde: N = f

Esta última ecuación es importante y debemos insistir en el concepto de que el


número total de datos, N , es igual a la sumatoria de todas las frecuencias, f

El siguiente ejercicio demuestra y generaliza la propiedad º 4.

a) Para N datos sin repetición,

Si N números, X1, X2, ...,XN, tienen desviaciones respecto de un número A, dadas por:

d1 = X1 - A
d 2 = X2 - A
... ... ...
dN = XN - A

Probar que :

X A+
 fd
N

Solución:
Como dj = Xj - A

es X j = A + di

Multiplicando ambos miembros de la ecuación por el operador sumatoria y dividiendo


por N nos queda:

Derechos de autor en trámite Página 25 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Nótese que el signo  se anula con N pues la sumatoria de A es N veces A.

b) Para el caso en que X1, X2, ...,XN tengan frecuencias f1, f2, ..., fN y

d1 = X1 - A

d2 = X2 - A

... ... ...

dk = Xk - A

Probar que:

Pues f = N

3.4 Cálculo de la media aritmética para datos agrupados

Para el cálculo de la media aritmética, utilizaremos tres tipos de fórmulas. Estas se


denominan fórmulas larga, corta y de compilación respectivamente.

La fórmula larga es la aplicación de la definición de la MEDIA ARITMÉTICA es decir


la fórmula “madre”:

X
 fX
N

La fórmula corta es la aplicación del método de la MEDIA CONJETURADA, es


decir, donde desde el principio del cálculo, conjeturamos el valor de la MEDIA
ARITMÉTICA como un valor A y determinamos el valor de las diferencias entre dicho
valor A y cada una de las X,

Derechos de autor en trámite Página 26 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

X A+
 fd
N

El método por compilación requiere una transformación de la última fórmula.


Si todos los intervalos de clase tienen idéntico ancho de clase c, las desviaciones
pueden expresarse como:
dj = c * uj
donde, uj pueden ser 0, 1, 2, etc. y la fórmula de la media aritmética se convierte
en:

  fu 
X  A + c  
 N 

llamada Fórmula del Método de Compilación para calcular la Media Aritmética.

3.5 Ejercicio de aplicación

El siguiente ejercicio, basado en la distribución de frecuencias vista en el capítulo nº


2, se utilizará las tres fórmulas vistas en los párrafos anteriores.
Recordemos la distribución, se trata de la altura de 100 estudiantes y el diagrama de
frecuencias es el siguiente:

Altura = X frecuencia
1.55 05
1.64 18
1.73 42
1.82 27
1.91 08
f=N=100

Desarrollo fórmula nª 1, Método Largo

Altura = X frecuencia fX
1.55 05 07.55
1.64 18 29.52
1.73 42 72.66
1.82 27 49.14
1.91 08 15.28
f=N=100 fX=174.35

Derechos de autor en trámite Página 27 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Desarrollo fórmula nº 2, Método Corto

Debemos partir haciendo una conjetura de cual puede ser la media del conjunto de
datos, observando la distribución es fácil concluir que la media aritmética se
encontrará cerca de 1,73 metros.

De ésta forma diremos que A es igual a 1,73.

Altura = X frecuencia = f desviación d=X-A fd


1.55 05 -0.18 -0.90
1.64 18 -0.09 -1.62
A: ===> 1.73 42 +0.00 +0.00
1.82 27 +0.09 +2.43
1.91 08 +0.18 +1.44
f=N=100 fd=+1.35

X A
 fd  1.73  1.35  1.74
N 100

Desarrollo fórmula nº 3, Método de Compilación.

En éste cálculo deberemos aplicar el concepto: d = cu, siendo u una variable que
puede ser: 0, ±1, ±2, ±3, etc.

Seguimos conjeturando que A = 1.73, pero ahora, vamos a observar que en la


columna d del calculo anterior, los números -0.18, -0.09, 0.00, 0.09, y 0.18, tienen
como factor común el número 0.09. Por lo tanto, si sacamos este factor común, los
números de la columna quedarán reducidos a los valores: -2, -1, 0, 1, 2 de tal forma
el esquema de cálculo es el siguiente: (en este razonamiento se volverá a insistir,
cuando se estudie la desviación típica)

X f u fu
1.55 5 -2 -10
1.64 18 -1 -18
1.73 42 +0 +00
1.82 27 +1 +27
1.91 8 +2 +16
f=100 fu=15

  fu   15 
X  A    c  1.73    0.09  1.74
 N   100 

Finalmente destaquemos los siguientes aspectos importantes:

1º La MEDIA CONJETURADA puede ser cualquier X dentro de los datos en estudio,


pero cuanto mas cercano esté al verdadero valor, menores serán los cálculos por
realizar. Por la forma de la distribución es fácil conjeturar donde se encontrará la

Derechos de autor en trámite Página 28 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

MEDIA ARITMÉTICA. El procedimiento aconsejado es conjeturar la marca de clase


que presente la mayor frecuencia de datos.
2º Cualquier X que sea elegido, el resultado final será siempre el mismo.

3.6 La Mediana

La MEDIANA de un conjunto de datos ordenados en magnitud, es, o el valor central,


o la media de los dos valores centrales.

Ejemplo: 5, 6, 8, 9, 11, 15, 17

La MEDIANA es el número 9, pues antes que él, hay 3 números y después de él hay
otros 3.

5, 6, 8, 9, 11, 15, 17, 19

Ahora la MEDIANA es la media aritmética entre el número 9 y el 11, o sea 10.


El símbolo que representa a la MEDIANA es el siguiente: X ~

Geométricamente, la MEDIANA, es el valor de X, que corresponde a la recta que


divide un HISTOGRAMA en dos partes de igual área.
El siguiente ejemplo sirve para destacar ciertas cualidades de la MEDIANA frente a la
MEDIA ARITMÉTICA.

Cinco empleados de una Empresa, ganan $4.52, $5.96, $5.28, $11.2, y $5.75 la
hora.
Hallar la MEDIANA, y la MEDIA ARITMÉTICA.
Lo primero que debemos hacer es ordenar los datos: 4.52, 5.28, 5.75, 5.96, 11.20

Por lo tanto, la MEDIANA es: 5.75

La MEDIA ARITMÉTICA es 6.54

Como puede apreciarse, la MEDIANA, no está afectada por el valor extremo 11.20,
tal como lo está la MEDIA ARITMÉTICA. El valor 6.54 esta fuertemente sesgado
(corrido) hacia la derecha por causa de un valor que no parece ser del grupo al cual
corresponden los otros cuatro datos. Esta cualidad hace que la MEDIANA sea muy
útil para el estudio de sueldos

Ejercicio:
En la tabla que sigue, se estudian los pesos de 40 unidades de un producto X, con la
precisión de 1 gramo. Construir la tabla de frecuencias, hallar la media aritmética, y
calcular la mediana por interpolación y por cálculo directo

138, 146, 168, 146, 161, 164, 158, 126, 173, 145, 150, 140, 138, 142, 135, 132, 147,
176, 147, 142, 144, 136, 163, 135, 150, 125, 148, 119, 153, 156, 149, 152, 154, 140,
145, 157, 144, 165, 135, 128

Derechos de autor en trámite Página 29 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Los pesos máximo y mínimo son: 176 y 119, el intervalo o rango es 57. Elegiremos
un ancho impar = 7. El diagrama de frecuencias resultante es:

Clases Marca de Distribución de frecuencias u fu


clase marcas
118-124 121 / 1 -4 - 4
125-131 128 /// 3 -3 - 9
132-138 135 ///// // 7 -2 -14
139-145 142 ///// /// 8 -1 - 8
146-152 149 ///// //// 9 0 0
153-159 156 ///// 5 1 5
160-166 163 //// 4 2 8
167-173 170 // 2 3 6
174-180 177 / 1 4 4
f=40 fu=-12

  fu   12 
X  A    c  149    7  147
 f   40 

X  147

Calculo de la MEDIANA por el método de la interpolación.

f ___
118-124 121 / 1  Por lo tanto, para “llegar” al dato 20,
que sería el
125-131 128 /// 3 de la MEDIANA, necesitamos 1, que lo toma-
132-138 135 ///// // 7 19 datos remos de la clase 149
139-145 142 ///// /// 8 __
146-152 149 ///// //// 9 _ _
153-159 156 ///// 5  El cálculo interpolando, será por regla
de tres
160-166 163 //// 4 12 datos
167-173 170 // 2 Si 9 datos, producen un salto de 7 en la
escala
174-180 177 / 1 _ _ de las X, 1 producirá,
proporcionalmente 0.8

Para hallar la MEDIANA sumaremos este valor hallado, 0,8 a la frontera de la clase
correspondiente, en éste caso, 145.5,

145.5 + 0.8 = 146.3

Derechos de autor en trámite Página 30 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

El resultado del cálculo de la MEDIANA por interpolación es 146.3

Por último, podríamos darnos la tarea de ordenar todos los datos, y encontrar el
valor 20 y 21 y hallar la media:

119, 125, 126, 128, 132, 135, .................., 145, 145, 146, 146, 147...........
1. 2, 3, 4, 5, 6, ................., 18, 19, 20, 21, 22..........

De acuerdo a la definición, la MEDIANA es la media entre los valores 20 y 21, esto


es: 146

3.7 La Moda

Otro de los medidores de la tendencia central es la MODA.

La MODA el valor que más se repite, es decir el de mayor frecuencia. La MODA


puede no existir, e incluso, puede no ser única.

El símbolo de la moda es: X

3.8 Relación empírica entre la Media Aritmética, la Mediana y la Moda.

Para curvas de frecuencias unimodales y que sean poco asimétricas, tenemos la


siguiente relación empírica:

MEDIA - MODA = 3 ( MEDIA -MEDIANA)

3.9 Media Geométrica.

La media geométrica G de un conjunto de números positivos, X1 , X2 , ..... , XN es la


raíz enésima del producto de todos esos números:

G N X1 . X 2 . ... . XN

Ejercicio 1 : La media geométrica de 2, 4, y 8 es:

G  3 2.4.8  3 64  4

Ejercicio 2 : Hallar a) la media geométrica y b) la media aritmética de los números

Derechos de autor en trámite Página 31 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

3, 5, 6, 6, 7, 10 y 12

Esto ilustra el hecho que la media geométrica de un conjunto de números positivos


en menor que la media aritmética

Ejercicio 3 : Los números X1,X2, ... XK ocurren con frecuencia f1, f2 ... fk

3.10 Media armónica.

La MEDIA ARMÓNICA H, de un conjunto de números X1,X2, ... XN es el recíproco de


la media aritmética de los recíprocos de esos números.

En la práctica es más fácil recordar que :

Derechos de autor en trámite Página 32 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Ejemplo: Una persona viaja de A a B con una velocidad media de 40 km. por hora y
regresa a 100 Km. por hora. La distancia entre A Y B es de 400 Km.
Entonces:

Tiempo para ir de A a B =

Tiempo para ir de B a A =

Tiempo total : 14 hs.

Recorrido total = 800 Km.

Velocidad promedio:

Este promedio es la media armónica de 40 y 100

Nótese que podríamos haber estado tentados a tomar la media aritmética de 40 y


100 = 70 km./h, lo cual es incorrecto.

Relación entre las medias aritmética, geométrica y armónica

H  G 
3.11 Ejercicios en clase.

Mediante la utilización de urnas con datos de una población normal, se deberá

elaborar en clase el siguiente trabajo:

a) Extracción de 40 datos con participación de todos los alumnos.


b) Elaboración de la distribución de frecuencias.
c) Histograma.
d) Cálculo de la media aritmética.
e) Cálculo de la moda.
f) Cálculo de la mediana por interpolación.

3.12 Ejercicios de Aplicación.


El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,
el alumno deberá resolverlos como parte de su desarrollo académico.

Derechos de autor en trámite Página 33 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 3
Media Aritmética: 3.6, 3.7, 3.8, 3.9, 3.10, 3.11, 3.19, 3.23, 3.24, 3.55, 3.59, 3.60,
3.61.
Mediana: 3.28, 3.29.
Moda: 3.31

Derechos de autor en trámite Página 34 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capitulo 4
4 Medidas de la dispersión de una distribución de datos.

4.1 Dispersión o Variación.

La dispersión o variación de los datos intenta dar una idea de cuán repartidos se
encuentran éstos.
Hay varias medidas de tal dispersión, siendo las más comunes el RANGO o
INTERVALO y la DESVIACION TIPICA.
Existen otros estimadores, pero están fuera del propósito de éste curso.

4.2 Rango o Intervalo

Es la diferencia entre el valor mayor y el valor menor de todos ellos.

Ejercicio:

Hallar el RANGO de los conjuntos :

Grupo 1: 12, 6, 7, 3, 15, 10, 18, 5 Grupo 2: 9, 3, 8, 8, 9, 8, 9, 18

Solución:

En primer lugar tendremos que ordenar los datos:

Grupo 1 : 3, 5, 6, 7, 10, 12, 15, 18 Grupo 2 : 3, 8, 8, 8, 9, 9, 9, 18

En ambos casos vemos que el resultado es 15, y observamos que el RANGO no


tiene la capacidad de informarnos sobre lo que sucede dentro del grupo, pues una
rápida inspección nos deja ver que el grupo 1 es mucho más disperso que el grupo 2.
Esto es una limitación a tener en cuenta en los estudios, sin embargo, el RANGO
es el medidor de dispersión más utilizado por la facilidad de cálculo.
En nuestro ejemplo, se puede mejorar la información, si decidimos eliminar, en
ambos grupos, los valores extremos, así, el RANGO sería 10 para el grupo 1 y 1 para
el grupo 2.
Como conclusión, podremos decir, que cuando hay valores muy extremos, el rango
es una pobre medida de la dispersión.

4.3 La Desviación Típica

La DESVIACIÓON TÍIPICA es el medidor de la dispersión máas importante.


DEFINICIÓON: La DESVIACIÓON TÍIPICA de un conjunto de N números: X1,
X2, ...XN se denota por  y se define por:

Derechos de autor en trámite Página 35 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Si X1, X2, ...,Xk se repiten con frecuencias f1, f2, ..., fk, la desviación típica se expresa
como:

pues f=N

Sobre el tamaño de N:
Hay un aspecto importante con respecto al tamaño de N. Si N es 30 o menor a 30, el
cociente en la fórmula, deberá ser N – 1. La demostración de esta conveniencia no
entra en los alcances de este curso, pero debe considerarse que la respuesta es
mejor cuando se divide por N – 1. Esta consideración es extensiva a todos los
desarrollos de fórmulas que veremos a continuación.

Ahora es necesario analizar un aspecto de las denominaciones. Existe en la

bibliografía diversos criterios para la denominación de la desviación típica y de la

media aritmética.

Población y Muestra, Estadísticos y Parámetros.

El alumno tiene que tener muy claro a esta altura del desarrollo de la materia, los
conceptos de UNIVERSO O POBLACION y de MUESTRA.
El UNIVERSO O POBLACION son todos los individuos que lo componen, por
ejemplo, todos los estudiantes del país del INACAP o la producción de clavos de todo
un día.
MUESTRA es una cantidad estadísticamente seleccionada y tomada al azar que
representa al UNIVERSO O POBLACION.

A partir de ahora nosotros llamaremos al total de datos POBLACION.


Las diferentes denominaciones que utilizaremos son las siguientes, el alumno
deberá estar atento a los cambios de la denominación , según lo que se esté
tratando. En general, la letras griegas corresponde a la población, y las letras
latinas a las muestras, usando siempre, las letras griegas para los desarrollos
de fórmulas.

La MEDIA ARITMETICA de la POBLACION La DESVIACION TIPICA de la POBLACION

Derechos de autor en trámite Página 36 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

se denomina con el signo griego:  se denomina con el signo griego:



La MEDIA ARITMETICA de la MUESTRA se La DESVIACION TIPICA de la MUESTRA se
denomina con el signo: X denomina con el signo: S
La CANTIDAD DE DATOS DEL UNIVERSO La CANTIDAD DE DATOS DE LA MUESTRA
se denomina con la letra: se denomina con la letra: n
N

Por otra parte, llamaremos Estadísticos a los medidores de la muestra, es decir a la


Media Aritmética y la Desviación Típica de la Muestra: X y S, y llamaremos
Parámetros a los medidores que describen la Población entera:  y 

Ejercicios de comprensión:

Hallar la S para los siguientes conjuntos de números:

a) 3, 5, 6, 7, 10, 12, 15, 18 b) 3, 8, 8, 8, 9, 9, 9, 18

a) X
X  76
 9.5 b) X
72
9
N 8 8

a) b)

Como se puede apreciar, la DESVIACION TIPICA da un valor significativamente


inferior para b) respecto de a), lo cual indica que los datos están menos dispersos en
este último grupo, cosa que pudimos apreciar observando directamente los datos.
Por esta razón la DESVIACION TIPICA es un excelente medidor de la dispersión de
los valores alrededor del dato central, usualmente, la MEDIA ARITMETICA.
Nótese que por ser una muestra de 8 unidades se ha utilizado para denominar la
desviación típica la letra S en lugar de .

Ejercicio:

Hallar la DESVIACION TIPICA de las alturas de los 100 estudiantes.


La MEDIA ARITMETICA calculada en el capítulo anterior fue de 1.74 mts.
La siguiente tabla contiene la información para hacer los cálculos:

Derechos de autor en trámite Página 37 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

X F (X-1.74) (X-1.74)2 f(X-1.74)2


1.55 05 -0.19 0.04 0.18
1.64 18 -0.10 0.01 0.18
1.73 42 -0.01 0.00 0.00
1.82 27 +0.08 0.01 0.17
1.91 8 +0.17 0.03 0.23
f=100 f(X-X)2=0.77

4.4 Desarrollo de tres fórmulas para el cálculo de la Desviación Típica

Las fórmulas vistas en la definición no son prácticas para el cálculo, por lo cual
haremos ciertas transformaciones, con la finalidad de que los cálculos sean
minimizados.

Desarrollo fórmula 1, Método Largo

El primer desarrollo es simplemente otra forma de escribir la misma fórmula de la


definición:

Derechos de autor en trámite Página 38 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Aplicaremos ésta fórmula a nuestro ejercicio de comparación de métodos:

Marca de f X2 fX2
clase
1.55 05 2.40 12.01
1.64 18 2.69 48.41
1.73 42 2.99 125.7
1.86 27 3.31 89.43
1.95 08 3.65 29.18
f=100 fX2=304.75

304.75
S  1.7435 2  0.09
100

Desarrollo Fórmula 2, Método Corto.

Volvemos a utilizar los mismos conceptos desarrollados para el mismo cálculo en la


MEDIA ARITMÉTICA.
Siendo A la media conjeturada y d la desviación de Xj respecto de A, será:

d=X-A por lo tanto X = A+d

Este resultado se reemplaza en la fórmula:

Derechos de autor en trámite Página 39 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Ahora bien, con ésta segunda fórmula podemos hacer el mismo desarrollo que
hicimos con la primera y el resultado será el mismo, por lo tanto la fórmula 2 es

Apliquemos ahora esta fórmula al ejercicio de las alturas de los alumnos:

X f d=X-A fd fd2
1.55 05 -0.18 -0.90 0.16
1.64 18 -0.09 -1.62 0.15
1.73 ==> A 42 +0.00 +0.00 0.00
1.82 27 +0.09 +2.43 0.22
1.91 08 +0.18 +1.44 0.26
f=100 fd = 1.35 fd2 = 0.79

Desarrollo Fórmula 3, Método de Compilación:

En el cuadro de desarrollo de la fórmula 2, podemos observar en la columna del


medio, que la columna de 5 números tienen un factor común que es 0.09 pues:

-0.18 = -2 * 0.09, -0.9 = -1 * 0.09, +0.00 = 0.0 * 0.09, +0.09 = +1 * 0.09,


+0.18 =+2 * 0.09

Este valor 0.09 es precisamente el ancho de clase = c por lo tanto la variable d la


podemos reemplazar por otra variable llamada u :

Derechos de autor en trámite Página 40 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

d=c*u

Esta variable u toma los valores : ...-2, -1, 0, +1 , +2, ... etc.

Si reemplazamos d en las fórmulas anteriores

Por lo tanto la fórmula final será:

Esta última fórmula es la llamada FÓRMULA DE COMPILACIÓN

Aplicaremos esta fórmula al ejercicio de las alturas de los estudiantes:

X f u fu fu2
1.55 05 -2 -10.00 20.00
1.64 18 -1 -18.00 18.00
1.73 42 +0 +00.00 00.00
1.82 27 +1 +27.00 27.00
1.91 08 +2 +16.00 32.00
f = 100 fu = 15 fu2 = 97

Apliquemos estos resultados a la fórmula 3:

Derechos de autor en trámite Página 41 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

4.5 Propiedades de la Desviación Típica

Propiedad nº 1

La desviación típica puede generalizarse como:

Donde a es un promedio distinto de la MEDIA ARITMÉTICA. De tales desviaciones


típicas, la mínima es aquella donde a = MEDIA ARITMÉTICA

Propiedad nº 2

Es la más importante de las propiedades de la desviación típica.

Para distribuciones normales, es decir, perfectamente simétricas, resulta que entre


los extremos de la distribución:

MEDIA ARITMÉTICA  1  = CONTIENE EL 68.27 % DEL AREA BAJO LA


CURVA NORMAL.

MEDIA ARITMÉTICA  2  = CONTIENE EL 95.45 % DEL AREA BAJO LA


CURVA NORMAL.

MEDIA ARITMÉTICA  3  = CONTIENE EL 99.73 % DEL AREA BAJO LA


CURVA NORMAL.

Geométricamente, en una distribución normal, la distancia entre el punto de


inflexión de la curva, y la perpendicular al eje de las absisas, en el valor
correspondiente a la Media Aritmética, es la DESVIACIÓN TÍPICA de dicha
población.

Mas adelante, cuando se estudie la distribución gaussiana se insistirá en este


concepto.

Derechos de autor en trámite Página 42 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

4.6 Varianza

La VARIANZA es otro medidor de la dispersión ligado, en este caso, a la Desviación


Típica.

La VARIANZA es el cuadrado de la DESVIACIÓN TÍPICA

Este medidor de la dispersión es muy importante y se utiliza para ciertos Analisis de


Varianza que pertenecen al campo de la Estadística Aplicada.

4.7 La Desviación Media

La Desviación Media o desviación promedio, de un conjunto de números X1,


X2, ...,Xk es abreviada por MD y se define como :

Desviación Media:

Ejemplo:

Hallar la Desviación Media del conjunto :

2, 3, 6, 8,11

Media Aritmética: 6

2  6  3  6  6  6  8  6  11  6
DM   2.8
5

Si X1, X2, ...,Xk se repiten con frecuencia f1, f2, ..., fk,

Entonces la DM, se puede escribir como:

f X
j 1
j j X
fX X
DM    X X
N N

k
Donde: f  f  N
j1

Ejercicio:

Derechos de autor en trámite Página 43 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Hallar la DM del conjunto a) 3, 5, 6, 7, 10, 12, 15, 18.

b) 3, 8, 8, 8, 9, 9, 9, 18.

Solución:

a) La media aritmética es 9.5

DM 
 X X 
34
 4.25
N 8

b) La media aritmética es 9.0

DM 
 X X 
18
 2.25
N 8

La DM indica que b) tiene menor dispersión que a)

Ejercicio:

Hallar la DM de las alturas de los 100 estudiantes de la Universidad XYZ.

La Media Aritmética ya calculada era 1.74

Altura = X frecuencia X-1.74 fX-1.74


1.55 5 0.19 0.95
1.64 18 0.10 1.80
1.73 42 0.01 0.42
1.82 27 0.08 2.16
1.91 8 0.17 1.36
f=N=100 =6.69

DM 
fX X 
6.69
 0.07
N 100

Recordemos que el valor de la Desviación Típica fue 0.09

Derechos de autor en trámite Página 44 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Como ejercicio adicional determinaremos el porcentaje de estudiantes que miden


entre:

a) Media aritmética  1DM

b) Media aritmética  2DM

c) Media aritmética  3DM

Solución: en primer lugar recordemos del Capítulo 2:

Limite inferior Limite Superior Frontera Marca de clase


1.51 1.59 1.595 1.55
1.60 1.68 1.685 1.64
1.69 1.77 1.775 1.73
1.78 1.86 1.865 1.82
1.87 1.95 1.955 1.91

Ancho de clase : 0.09

50 42
1.67 1.81
40
Frecuencias

27
30
18
20
8
10 5

0
1,55 1,64 1,73 1,82 1,91

1,685 1,775

a) 1.74+ 0.07 = 1.81 y 1.74 - 0.07 = 1.67

Es decir nos interesa saber cuantos alumnos se encuentran dentro del intervalo de
1.67 a 1.81 mts.

Este intervalo incluye a todos los integrantes de la tercera clase, los 42, más,

(1.67- 1.685) / 0.09 de los de la segunda, más,

(1.81- 1.775) / 0.09 de los de la segunda, más,

O sea, el número de estudiantes, en el intervalo: Media aritmética  1DM, es :

Derechos de autor en trámite Página 45 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

42 + (0.015/0.09)x18 + (0.035/0.09)x 27= 42 + 3 + 10.5 = 55.5

Es decir que entre más 1DM y menos 1DM se encuentran el 55.5 % de los
estudiantes.

Con el mismo criterio se procederá con el resto de los intervalos:

b) Media aritmética  2DM = 1.74  2 x 0.07

Esto es de 1.60 a 1.88, los cálculos serán ahora, los siguientes.

42 y 27 entran todos, más

(1.685-1.60) / 0.09 de la segunda, más

(1.88 - 1.865) / 0.09 de la quinta clase, o sea:

42 + 27 + (0.015/0.09)x18 + (0.035/0.09)x 8= 42 + 27 + 17 + 1.3 = 87.3

Es decir que entre más 2DM y menos 2DM se encuentran el 87.3 % de los
estudiantes.

b) Media aritmética  3DM = 1.74  3 x 0.07

Esto es de 1.53 a 1.95, los cálculos serán ahora, los siguientes.

(1.595-1.53) / 0.09 de la segunda, más

(1.95 - 1.865) / 0.09 de la quinta clase, osea:

42 + 27 + 18 + (0.0722/0.09)x 5 + (0.085/0.09)x 8= 42 + 27 + 18 + 4 + 7.6 = 98.6

Es decir que entre más 3DM y menos 3DM se encuentran el 98.6 % de los
estudiantes.

4.8 Ejercicios en clase.

Utilizando la distribución de frecuencias del ejercicio de clase que se realizó para el


capítulo 3, se deberá calcular:
a) el Rango o Intervalo.
b) La Desviación Típica.
c) La Varianza.
d) La Desviación Media.

4.8 Ejercicios de Aplicación.

Derechos de autor en trámite Página 46 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico.

Desviación Típica: 4.18, 4.19, 4.40, 4.41.

Derechos de autor en trámite Página 47 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 5
5 CUANTILOS

5.1 DEFINICIÓN:

Los cuantilos son una familia de Estimadores Estadísticos que se utilizan


indistintamente tanto para estimar la tendencia central de una distribución como para
calcular valores que nos informe acerca de la dispersión que estos presentan y poder
compararlos entre distribuciones.

Si bien por la importancia de la MEDIANA se la toma fuera de la familia de los


cuantilos, en rigor ésta es el primer cuantilo. Es decir, es el valor que, habiendo
ordenado la serie de datos, se encuentra exactamente en el medio de la fila.

Con el mismo criterio podremos encontrar los valores que dividen serie en 4 partes
iguales, es decir, si tenemos una serie de 100 datos, ordenados de menor a mayor,
los datos números 25, 50 y 75 dividen la lista en 4 partes iguales.
Por ésta razón, estos cuantilos se denominan : CUARTILOS
Si la serie no fuera de 100 datos, fuera por ejemplo de 180, los datos buscados
serian el 45, el 90 y el 135. Es decir aquel valor que separe el 25%, el 50% y el 75%.
Con el mismo criterio, existen los DECILES, que dividen la serie en 10 partes y los
PERCENTILES, que dividen la serie en 100 partes iguales.

Los QUARTILOS son tres, Q1, Q2 Y Q3

Los DECILES son 9, D1, D2, ... , D9

Los PERCENTILES son 99, P1, P2, ..., P99.

Nótese que la MEDIANA es igual a Q2 = D5 = P50

5.2 MEDIDORES DE LA TENDENCIA CENTRAL

Una buena propiedad de los cuantiles es que no están afectados por los valores
extremos o de borde, los cuales a veces reflejan anomalías o valores que se apartan
de la distribución por causas específicas. Los cuantilos utilizan valores que están
adentro de la distribución y por lo tanto son valores normales.
Para medir la tendencia central comenzamos por definir los estimadores del
PROMEDIO o valor central de la distribución:

PROMEDIO CUARTÍLICO = (Q3 + Q1)/2


PROMEDIO PERCENTÍLICO, 10 - 90 = (P90+P10)/2
Nótese con mucha atención que estos valores, no tienen por que coincidir con la
MEDIANA = Q2 = D5 = P50, esto sucede, únicamente si la distribución es simétrica
, solo así, coincidirán todos los estimadores de la tendencia central. Más adelante, al
estudiar las distribuciones Gaussianas comprenderemos mejor éste asunto. En
general, las distribuciones reales, no son perfectas, por lo tanto, cada uno de los
estimadores, darán valores parecidos pero no iguales. El estudioso estadístico,
determina, cual de los valores se ajusta mejor a los fines que persigue.

Derechos de autor en trámite Página 48 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

5.3 MEDIDORES DE LA DISPERSIÓN

Como puede comprenderse, por la cantidad de valores que podríamos seleccionar,


sería posible determinar una gran lista de posibles estimadores, los cuatro que se
mencionan a continuación son los más comunes.

INTERVALO CUARTÍLICO: Q3 - Q1
INTERVALO PERCENTIL 10,90 : C90 - C10
INTERVALO SEMI INTERCUARTÍLICO : (Q3 - Q1)/2
INTERVALO SEMI PERCENTÍL 10,90 : (C90 - C10)/2

En el siguiente ejemplo, se ilustra la utilización de los distintos estimadores.

Los siguientes datos, 99 en total están ordenados de menor a mayor :

# dato # dato # dato # dato # dato


1 18 21 33 41 42 61 70 81 100
2 19 22 33 42 43 62 70 82 102
3 19 23 34 43 44 63 71 83 105
4 21 24 35 44 45 64 73 84 105
5 21 25 35 45 46 65 73 85 106
6 21 26 35 46 49 66 74 86 108
7 23 27 35 47 50 67 75 87 110
8 24 28 35 48 55 68 75 88 111
9 25 29 35 49 55 69 76 89 112
10 26 30 36 50 56 70 78 90 113
11 26 31 36 51 57 71 80 91 115
12 29 32 38 52 59 72 83 92 118
13 30 33 38 53 60 73 83 93 119
14 31 34 39 54 60 74 86 94 120
15 31 35 39 55 60 75 89 95 122
16 32 36 39 56 65 76 92 96 122
17 32 37 39 57 65 77 92 97 123
18 33 38 40 58 67 78 93 98 124
19 33 39 40 59 67 79 95 99 125
20 33 40 41 60 68 80 99

En esta tabla, que representa una población de 99 datos, identificaremos primero,


cada uno de los valores a ser usados en los cálculos:

CUARTILOS: Q1 = 35, Q2 = 56, Q3 = 89

MEDIANA = Q2 = D5 = P50 = 56

PERCENTIL 10 = 26, PERCENTIL 90 = 113

Nótese que el estudio se realizó sobre 99 datos y no sobre 100, pues con 99 se logra
la simetría perfecta para cada uno de los cuantilos. Por ejemplo, la Mediana tiene 49

Derechos de autor en trámite Página 49 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

datos a cada lado del dato 50, Q1 tiene 24 datos anteriores, y Q3 24 datos
posteriores, etc.

5.4 PROCEDIMIENTOS DE CÁLCULO

Estimación de los valores centrales:

MEDIA ARITMÉTICA : X/99: 62


MEDIANA: 56
PROMEDIO CUARTÍLICO: (Q3+Q1)/2: (89+35)/2: 62
PROMEDIO PERCENTÍLICO 90,10: (P90+P10)/2 : (113+26)/2: 69.5

Estimación de la dispersión de los valores:

DESVIACIÓN TÍPICA: (a partir de la fla. gral. con calculadora): 32.3


INTERVALO SEMI INTERCUARTÍLICO: (Q3-Q1)/2: (89-35)/2: 27.0
INTERVALO PERCENTÍLICO 90,10: (P90-P10)/2: (113-26)/2: 43.5

Como puede observarse, los resultados son bien diferentes, esto se debe a varios
factores, en primer lugar, la distribución de los datos seleccionados, no son simétricos
ni se parecen a una distribución Normal o Gaussiana. Si bien aún no hemos
estudiado el tema de la distribución NORMAL o Gaussiana, el alumno ya puede
formarse una idea de que esta importante distribución es de forma de campana, y
tiende a ser simétrica.
La distribución que hemos utilizado no lo es, y eso asegura que los distintos
estimadores estadísticos difieran entre si. La pregunta es entonces: ¿para que
sirven? La respuesta es: para comparar, es decir, podemos comparar sucesivas
distribuciones entre sí, y ver si se dispersan más o menos que la anterior y si los
valores centrales se acercan a lo que se especifica. ¿Cual usar?, el que a criterio del
analista responda mejor a los objetivos que se buscan. Lo importante es que una vez
determinado cual será el estadístico a utilizar, seamos coherentes y utilicemos para
comparar siempre el mismo estadístico.

5.5 Procedimiento de cálculo para datos agrupados.

Cuando la cantidad de datos es grande, y estos se encuentran agrupados en


CLASES, el cálculo de los distintos estimadores debe realizarse por el método de la
interpolación. Para estudiarlo volveremos a nuestro ejemplo de las alturas de los 100
estudiantes.

La tabla de distribución es la siguiente:

Derechos de autor en trámite Página 50 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Fronteras de Límites de Marca de frecuencia Ojiva


clases clases clase de clases
clase nº 1 1.505 1.51-1.59 1.55 5 05
clase nº 2 1.595 1.60-1.68 1.64 18 23
clase nº 3 1.685 1.69-1.77 1.73 42 65
clase nº 4 1.775 1.78-1.86 1.82 27 92
clase nº 5 1.865 1.87-1.95 1.91 8 100
f=100

Supongamos que nos interesa buscar el valor de Q1, esto es el valor 25

De acuerdo con la ojiva, el valor 25 se encuentra en la clase nº 3, en esta clase hay


42 datos, pero solo necesitamos 2 para llegar a 25. El razonamiento por interpolación
es el siguiente:

42 valores que están en la clase nº 3, producen un cambio en el ordenamiento de


dimensión 0.09, es decir el ancho de clase., proporcionalmente, 2, que son los que
necesito, produciran,:0.004
Este valor es la alícuota que debe sumarse, ¿a quién? a la frontera de clase: 1.685,
por lo cual el valor buscado es 1,689, y aproximando, 1,69.

Resultado, Q1 = 1,69

De igual forma., podemos calcular Q3 y con ambos saber cuanto es el intervalo y el


promedio INTERCUARTÍLICO.

Por último y para dejar el tema completo, calcularemos otro dato, en éste caso, el
valor del percentilo 90, es decir P90.

De acuerdo a la ojiva, el valor 90, está en la clase 4, el razonamiento, igual al


anterior será:

27 datos producen un incremento en las X de 0.09, por lo tanto, 25 serán :


(25*0.09)/27=0.083
Este valor lo sumamos a la frontera de clase 1.775, con lo cual obtenemos : 1.858 y
aproximando a los valores significativos da 1.86

Resultado P90 = 1.86

Se sugiere al alumno, calcular P10 y con ambos valores calcular el intervalo semi
percentílico y el promedio correspondiente.

5.6 Obtención de los valores correspondientes cuando el numero de datos es


distinto de 100:

Por razones pedagógicas, se ha utilizado una distribución de 100 datos para hacer
estos cálculos, pero el alumno debe saber encontrar cualquier dato en una
distribución dada. Daremos dos ejemplos:

Derechos de autor en trámite Página 51 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Ejemplo uno:

Distribución de 80 datos, el valor de Q1 será el dato 20, es decir, 80 * 0.25


el valor de P90 será el 72, es decir 80 * 0.90

Ejemplo dos

Distribución de 120 datos, Q1 será el valor 30, (120 * 0.25)


el valor de P90, será el 108, ( 120 * 0.90)

5.7 Ejercicios en clase:

Utilizando la distribución de frecuencias determinada en clase para el cálculo de la


media aritmética y la desviación típica (Capítulos 3 y 4), el alumno deberá calcular la
mediana, los tres cuartilos, el promedio y el intervalo semiintercuartílico.
Posteriormente se deberá realizar una tabla donde se ingresen todos los medidores
de tendencia central y de dispersión para compararlos y discutir sobre ellos.

5.8 Ejercicios de Aplicación.

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico.

Capítulos 3 y 4:
Cuantílos: 3.44, 3.107, 3.108, 4.6, 4.7, 4.8, 4.48, 4.52.

Derechos de autor en trámite Página 52 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 6
6 Teoría elemental de Probabilidades

6.1 Definición de Probabilidad

6.1.1 Definición Clásica:

Supongamos que un suceso tiene h posibilidades de ocurrir entre n posibilidades,


cada una de las cuales tiene la misma oportunidad de ocurrir que las demás.

Entonces, la probabilidad de que ocurra E (éxito), se describe como:

h
p  PrE 
n

La probabilidad de que no ocurra E, es decir, la probabilidad de Fracaso, se escribe


como:

n h h
q  PrnoE   1   1  p  1  PrE pues p + q = 1
n n

6.1.2 Definición como frecuencia relativa:

La definición clásica de probabilidad tiene el cuestionamiento de que la palabra


“misma oportunidad” aparecen como sinónimas de “equiprobables” lo cual produce un
círculo vicioso.
Por esta razón, algunos autores defienden una definición estadística de probabilidad.

Para ellos, la probabilidad estimada o probabilidad empírica, de un suceso, se


define como la frecuencia relativa de ocurrencia del suceso cuando el número de
observaciones es muy grande. La probabilidad misma es el límite de esa frecuencia
relativa cuando el número de observaciones crece indefinidamente.

El siguiente ejemplo servirá para aclarar el concepto:

Si en una serie de 1000 tiradas de una moneda salen 529 caras, la frecuencia
relativa es de 529/1000 = 0,529.
Si en otras 1000 veces, salen 493, la frecuencia relativa acumulada será:
(529+493)/2000=0.511.
Si continuamos indefinidamente con éste método, el límite será 0,50000.....

6.2 Concepto de Probabilidad.

El siguiente gráfico ilustra progresivamente, el concepto de la probabilidad, desde un


suceso con imposibilidad absoluta hasta un suceso con certeza absoluta.

Derechos de autor en trámite Página 53 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Certeza absoluta

100% 100% Que un hombre muera algún día


95%
90%
85% 83.3% Que salga “no cuatro” al arrojar un dado normal. (5 en 6)
80%
75%
70% 70% No figura en cartas españolas (28 en 40)
65%
60%
55%
50% 50% Cara al arrojar una moneda ( 1 en 2)
45%
40%
35%
30% 32.4% Primera docena en la ruleta (12 en 37)
25%
20%
15%
10%
05% 7.7% K en un mazo de pocker (4 en 52)
00% 0.0% que salga un 7 al arrojar un dado normal.

Imposibilidad absoluta

Como podemos ver, las probabilidades resultan del cociente:

Casos favorables
P
Total de casos

El suceso buscado, puede ser de afirmación o de negación, (“que no salga figura”).


La probabilidad se puede expresar como fracción decimal o porcentual:

De la definición de probabilidad se deduce que :

0  P  1

ó 0  P  100

Derechos de autor en trámite Página 54 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

El alumno, tiene necesariamente que comprender en éste punto, que la expresión de


las probabilidades, no puede ser mayor que uno (100%) ni menor que cero(0%)

6.3 Regla de la adición de probabilidades

Consideremos el siguiente ejemplo:


Calcular la probabilidad de que quede el 4 ó el 5 en la cara superior de un dado
normal arrojado libremente.

Es evidente que si al arrojar un dado sale un cuatro, no podría salir el 5 y viceversa.

Es decir, estos sucesos son excluyentes entre sí, son EXCLUYENTES entre si, se
eliminan uno a otro. Si ocurre un suceso, no puede ocurrir el otro.

Para estos casos, se aplica la regla de la adición de las probabilidades que dice:

La probabilidad de que ocurra un suceso compuesto de dos o más sucesos que


se excluyen entre si, es igual a la suma de las probabilidades de cada uno de
estos sucesos.

En todos estos casos el enunciado del problema pide la probabilidad de un suceso


compuesto de uno ó de otro. Es decir, 4 ó 5 en nuestro ejemplo.

Por esta razón se conoce ésta regla como la REGLA O .

Resolviendo nuestro problema tenemos:

Observemos que en estos casos, (sucesos EXCLUYENTES) la probabilidad total es


mayor, o a lo sumo igual, que la mayor probabilidad de los sucesos intervinientes, es
decir:

Pt  Pi

6.4 Regla del producto de las probabilidades.

Derechos de autor en trámite Página 55 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Se arrojan dos dados normales, uno rojo y otro azul.


¿Cuál es la probabilidad de obtener un 4 en el rojo y 5 en el azul?
Observar que esta situación es distinta que la anterior, si sale un 4 en el dado rojo
nada impide que salga el 5 en el azul.
Estos son acontecimientos NO EXCLUYENTES entre sí, no se eliminan el uno al
otro.
La regla es del producto y dice:

La probabilidad de que ocurra un suceso compuesto de dos o más eventos, que


no se excluyen entre si, es igual al producto de las probabilidades que tiene
cada uno de esos sucesos.

Nuestro problema pide la probabilidad de un suceso compuesto de uno y otro, es


decir, 4 y 5 , por esta razón la llamaremos regla y

Del ejemplo precedente, se ve que la probabilidad total, en estos casos, esa menor
que la menor probabilidad de los sucesos intervinientes.
Es decir:

Pt  Pi

El alumno deberá notar que las probabilidades en la segunda regla son menores que
en la primera regla, la circunstancia de que la regla de multiplicar, intuitivamente
generadora de valores mayores que la suma, se explica por la circunstancia de que la
multiplicación se efectúa con números decimales, y esto arroja siempre un valor más
pequeño, ejemplo:

0.2 * 0.3 = 0.06

donde 0.06 es, pese a la multiplicación, menor que 0.2 y 0.3.

6.5 Aplicación de ambas reglas

Se arrojan dos dados, calcular la probabilidad de que se obtenga un 4 y un 5.

Derechos de autor en trámite Página 56 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Este problema parece el mismo que el anterior pero no es así. el 4 ó el 5 puede salir
en cualquiera de los dados. Supongamos que un dado es rojo y el otro azul.
Podemos obtener 4 en el rojo y 5 en el azul. o bien 5 en el rojo y 4 en el azul. en
ambos casos satisfacemos lo que el enunciado pide.
Si sale 4 en el rojo (suceso simple), nada impide que salga el 5 en el azul. Entonces
corresponde el producto de las probabilidades.
Lo mismo ocurre para el 4 en el azul y el 5 en el rojo.
Pero, si sale 4 en el rojo y 5 en el azul(suceso compuesto) no puede salir el 5 en el
rojo y el 4 en el azul. Por lo tanto corresponde la suma de las probabilidades de cada
uno de estos sucesos compuestos.

Veamos otro ejemplo:

Se arrojan dos dados normales.

Calcular la probabilidad de obtener 9 como suma de las caras superiores.

En este caso, el problema se satisface con 4 alternativas:

que salga 3 y 6 ó 4 y 5 ó 6 y 3 ó 5 y 4

Ptotal = P3y6 + P4y5 + P6y3 + P5y4

Cada término de la suma vale 1/36= 1/6 * 1/6

Ptotal= 4 * 1/36 = 1/9 = 11.1%

6.6 Probabilidades con y sin reposición

Cuando un elemento es extraído de una Población, y tenemos que volver a sacar


otro elemento, se nos presentan dos posibilidades. La primera es reponer a la
Población el primer elemento retirado, con lo cual la Población queda como al
principio, es decir que la segunda extracción tendrá la misma probabilidad de
extracción que el primero.

Derechos de autor en trámite Página 57 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

La segunda alternativa, que es la más frecuente, es que no se reponga la primera


unidad extraída, con lo cual la probabilidad para la segunda extracción habrá
cambiado.

Para aclarar el tema desarrollemos un suceso muy simple, supongamos que tenemos
una Población de 10 especiímenes, y que tenemos que extraer dos unidades, la
probabilidad de la primera extracción es de 1/10=0.1000, ahora bien, la segunda
extracción tendrá distinta probabilidad según lo que hagamos con el primer
espécimen, si lo volvemos a la población, la probabilidad volverá a ser de 1/10, pero
si no lo volvemos, la población es ahora de 9 especiímenes, por lo tanto, la
probabilidad de la segunda extracción será 1/9= 0.1111

Veamos otro ejemplo, Calcular la probabilidad de hallar una pieza defectuosa y otra
buena si se toman dos piezas de un lote de 20 piezas cuya fracción defectuosa es
del 5%.

Esto quiere decir que 19 piezas son buenas y una es mala.

Con reposición:

P(buena) = 19/20 = 0.95

P(mala) = 1/20 = 0.05

Por lo tanto la probabilidad de que la primera sea buena y la segunda mala es:

0.95 * 0.05 = 0.0475

Pero, otro resultado posible, y que también satisface el enunciado del problema es
que la primera sea mala y la segunda buena, el resultado será el mismo:

0.05 * 0.95 = 0.0475

Y el resultado final será: 0.0475+0.0475 = 0.0950 = 9.5%

Sin reposición

Los sucesos posibles son, a)buena - defectuosa y b) defectuosa - buena

Para a) sin reponer la pieza extraída:

19 1
Pa  *  0.05
20 19
1 19
Pb  *  0.05
20 19

Ptotal  Pa  Pb  0.05  0.05  0.10

Derechos de autor en trámite Página 58 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Como se ve ambos resultados son distintos.

En la práctica, lo más frecuente es que las extracciones sean sin reposición, pero
también sucede que las poblaciones son cantidades grandes, y cuando así sucede,
la modificación que se produce en la población por sucesivas extracciones no son
significativas para el cálculo de probabilidades.

6.7 Probabilidad de las causas, Fórmula de Bayes - Laplace

Probabilidad de las causas

Para comprender éste tipo de problemas, recurriremos a la idea de trabajar con


urnas.

Supongamos 4 urnas A con 7 bolillas blancas y 3 rojas, en cada una, y 6 urnas


B con 2 bolillas blancas y 8 rojas en cada una

Se escoge una urna al azar y de la misma se extrae una bolilla, también al azar,
obteniendo una bolilla blanca, es decir que el suceso b se ha producido.

¿Cuál es la probabilidad de que la urna escogida sea de la familia de urnas A ?

Antes de que se sacase una bolilla y se conociera su color, la probabilidad de ser


elegida una urna
A ó B , estaba perfectamente definida, (1/4 y 1/6), pero el conocimiento de la bolilla
extraída, altera esa probabilidad.
Como el suceso se ha producido, la probabilidad es a “posteriori”,. es decir,
buscamos la probabilidad a “ posteriori “ de la causa A o de la causa B ,
sabiendo que el suceso b se ha producido.

Para resolverlo se aplica la fórmula de Bayes - Laplace

Donde:

es la probabilidad a ” posteriori” de la causa A.

Wi es la probabilidad a “priori” de la causa A

pi es la probabilidad de que actuando la causa A el suceso se verifique.

 Wi pi es la sumatoria de los productos análogos posibles.

Derechos de autor en trámite Página 59 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

De acuerdo a esto tenemos :

Wi = 4/10, probabilidad de la urna

pi = 7/10 , probabilidad de extraer una blanca en A

Por lo tanto la probabilidad de que la urna sea del grupo A , si la bolilla es blanca:

y también podemos calcular el complementario:

Como es de esperar la suma de ambos resultados deberá ser necesariamente igual a


uno.

Ejercicios de comprensión:

Los siguientes problemas se les sugieren resolver al alumno. Los resultados están al
terminar el enunciado.

Problema 1:

Se tiene un grupo M formado por 4 urnas, con 4 bolillas rojas y 2 azules cada una.
Otro grupo N, formado por 6 urnas conteniendo cada una 3 bolillas rojas y 5 azules.

Se selecciona una urna al azar del grupo de diez y de ella se extrae una bolilla,
también al azar, resultando roja.

¿Cual es la probabilidad de que la urna seleccionada provenga del grupo N ?

Respuesta: 45.80%

Problema 2 :

Derechos de autor en trámite Página 60 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Supongamos que una caja contiene bolillas blancas y rojas marcadas con P; Q; ó R
como sigue:

Marcadas con P : 5 blancas y 3 rojas,


Marcadas con Q : 4 blancas y 4 rojas,
Marcadas con R : 1 blanca y 7 rojas.

Se extrae una bolilla al azar y resulta blanca, ¿ Cual es la probabilidad de que la


bolilla blanca seleccionada esté marcada con la letra P? Cuál con la letra Q ? ¿ y con
la letra R?

Respuesta: 50,0%, 40,0% y 10,0% respectivamente.

6.8 Ejercicios de aplicación.

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico.

Capítulo 6:
Probabilidades: 6.3, 6.5, 6.6, 6.8, 6.33, 6.42, 6.43, 6.44, 6.45, 6.46, 6.47, 6.50,
6.51, 6.90.

Derechos de autor en trámite Página 61 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 7
7. Análisis Combinatorio y Probabilidades

7.1 Principio fundamental del análisis combinatorio.

El análisis combinatorio nos provee una herramienta muy importante para el cálculo
de probabilidades complejas y que no podríamos valorizar con los métodos que
hemos aprendido hasta ahora. Este cálculo matemático se unirá a lo visto en el
capítulo anterior para desarrollar lo que llamaremos distribución binomial en el
próximo capítulo

El principio fundamental dice:

Si un suceso puede ocurrir de n1 maneras y si cuando éste ha ocurrido, otro


suceso puede ocurrir de n2 maneras, entonces el número de maneras en que
ambos pueden ocurrir en el orden especificado es:

n1 * n2

Ejemplo: Si hay 3 candidatos para gobernador y 5 para alcalde, los dos cargos se
pueden ocupar de 3 * 5 = 15 formas.

7.2 Factorial de n.

La factorial de n, denotada por n! se define como:

n! : n(n-1)(n-2)....3*2*1
.

Ejemplos:

5! = 5*4*3*2*1 = 120

4!*5! = 4*3*2*1*5*4*3*2*1 = 2880

Y se define:
Factorial del número cero = uno

0! = 1

7.3 Permutaciones.

Una permutación de n objetos tomados de r en r es una selección ordenada de r


objetos de entre n.

Derechos de autor en trámite Página 62 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

El número de permutaciones de n objetos tomados de n en n se denota por Pn,r y


viene dado por:

Pn,r = n(n-1)(n-2)...(n-r+1)= n! / (n-r)!

En particular, el número de permutaciones de n objetos tomados de n en n

Pn,n = n!

Ejemplo, el número de permutaciones que se pueden dar de las letras a, b, y c,


tomadas de a dos son:

P(3,2) = 3*2 = 6

Son ab, ac, ba, ca, bc, y cb

7.4 Combinaciones.

Una combinación de n objetos tomados de r en r es una selección de r de ellos,


sin importar el orden de los r escogidos.

El número de combinaciones de n objetos tomados de r en r se denota por:

 n n(n  1)(n  2 )...(n  r  1) n!


   
 r r! r !(n  r ) !

Otra forma de denotar al numero Combinatorio es: Cn,r

Ejemplo: El número de combinaciones de las letras a, b, y c, tomadas de dos en dos


es:

 3 3.2.1
   3
 2 2.1

Son ab, bc y ac

Nótese que ab y ba son la misma combinación pero no la misma permutación.

7.5 Probabilidades y análisis combinatorio.

Para interpretar el tema lo haremos a través de un ejercicio.

Una caja contiene 8 bolas rojas, 3 blancas y 9 azules.

Derechos de autor en trámite Página 63 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Si se sacan 3 bolas al azar, determinar la probabilidad de que:

a) las 3 sean rojas


b) las 3 sean blancas
c) 2 rojas y una blanca
d) al menos una sea blanca
e) una de cada color

En primer lugar debemos destacar que esto problemas se resuelven siempre


sobre la base de que la extracción se realiza sin reposición.

a) las 3 sean rojas

De acuerdo con el anterior razonamiento, esto se resuelve así:

Ahora bien, si razonamos de acuerdo a los números combinatorios, tenemos:

Con el mismo criterio resolveremos los otros casos.

b) Que las tres sean blancas:

c) Que dos sean rojas y una blanca:

d) Para resolver este caso, que al menos una sea blanca, tenemos dos caminos, el
primero sería calcular la probabilidad de que una sea blanca, de que dos sean
blancas y que las tres sean blancas y luego sumar los tres resultados. Pero otro
camino, que suele ser más corto, es calcular que ninguna sea blanca y esto restarlo
de uno. Nosotros resolveremos por el segundo camino y se sugiere al alumno que lo
confirme por la otra vía.

Derechos de autor en trámite Página 64 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

e) Una de cada color. Aquí debemos prestar atención de que no están pidiendo que
salgan en un orden determinado, El cálculo por la vía del número combinatorio nos
da precisamente el resultado acumulado de todas las alternativas posibles.

7.6 Generalización del número combinatorio y probabilidades

Este importante ejercicio nos introduce en la llamada DISTRIBUCIÓN BINOMIAL.

Determinar la probabilidad de sacar tres veces el 6 en 5 tiradas de un dado.

Representemos la 5 tiradas por 5 espacios

_ _ _ _ _

En cada espacio tendremos los sucesos 6 o no 6

Por ejemplo:
6 6 6 6 6
o
6 6 6 6 6

Derechos de autor en trámite Página 65 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Ahora bien la probabilidad de un suceso como cualquiera de los dos descritos es:

3 2
1 1 5 1 5  1  5 

P 66666   * * * *    
6 6 6 6 6  6  6

Cualquiera de las combinaciones nos dará el mismo resultado.

Pero la pregunta es: ¿cuántas combinaciones hay?

 5
la respuesta es    10 de tales sucesos mutuamente EXCLUYENTES por lo
 3
tanto la probabilidad requerida es:

Ahora podremos generalizar:

5 es el total de intentos que llamaremos N

1/6 es la probabilidad de éxitos y lo llamaremos p

5/6 es la probabilidad de fracasos y lo llamaremos q

por último 3 es la probabilidad de obtener tantas veces p en N intentos y lo


llamaremos X,

Con ésta generalización la fórmula se puede escribir:

7.7 Ejercicios de Aplicación.

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico.

Capítulo 6:

Derechos de autor en trámite Página 66 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Permutaciones: 6.17, 6.18, 6.19, 6.20, 6.21, 6.22, 6.24, 6.66, 6.71,
Combinaciones: 6.25, 6.26, 6.27, 6.28, 6.29, 6.30. 6.72, 6.74, 6.75, 6.78.
Probabilidades y análisis combinatorio: 6.32, 6.33, 6.34, 6.35.

Derechos de autor en trámite Página 67 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo: 8
LAS DISTRIBUCIONES BINOMIAL, POISSON Y NORMAL.

8.1 LA DISTRIBUCIÓN BINOMIAL

Definición: Si p es la probabilidad de que ocurra un suceso en un solo intento


(llamada probabilidad de éxito),entonces la probabilidad de que el suceso ocurra
exactamente X veces en N intentos ( o sea X éxitos y N-X fracasos viene dado por :

 N N!
PX    p X qN  X  p X qN  X
 X X !N  X!

Ejemplo: La probabilidad de obtener exactamente 2 caras en 6 tiradas de una


moneda es:

N=6, p=½,q=½,X=2

Se recomienda al alumno que, antes de desarrollar la fórmula, identifique claramente


los valores de N, p, q y X, tal como se muestra en éste ejercicio.

VARIABLES DISCRETAS Y CONTINUAS

Se dice que una variable es discreta, cuando los datos se cuentan, y es continua
cuando los datos se miden. por ejemplo, la producción de sillas es discreta pues un
lote puede ser, por ejemplo de 25 sillas o de 43 sillas, pero no de 25,6 ó 43,25 sillas
pues la fracción no es silla. En cambio, el diámetro de un perno es una variable
continua pues la puedo medir con tanta precisión como resolución tenga el
instrumento, ejemplo 12,345 milímetros.

La distribución de probabilidad binomial se aplica a variables discretas


únicamente.

DESARROLLO DEL BINOMIO

Derechos de autor en trámite Página 68 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

La distribución de probabilidad discreta se llama DISTRIBUCIÓN BINOMIAL porque


para: X = 1, 2,..., N corresponde a términos sucesivos de la fórmula binomial o
desarrollo del binomio.

 N  N
q  pN  qN    qN 1p    qN 2 p 2  ... p N
 1  2

donde:

 N  N
1,   ,   ,... se llaman
 1  2

Coeficientes Binomiales

ALGUNAS PROPIEDADES DE LA DISTRIBUCIÓN BINOMIAL:

VALOR MAS PROBABLE: Np

VARIANZA : Npq

DESVIACION TIPICA = Npq

TRIÁNGULO DE PASCAL

El triángulo de Pascal, nos da los valores de cada término del binomio:

1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
....................................................

Si observamos el desarrollo del binomio de Newton, vemos que cada sumando


representa una probabilidad y, si N, p y q son constantes, cada término nos da la
probabilidad para X = 0, 1, 2, ... hasta N.
Por esta razón se lo denomina también DISTRIBUCIÓN BINOMIAL

Si generalizamos tenemos:
q  pN  P0  P1  P2  ... PN
Por otra parte, q+p = 1 por lo cual la suma anterior también es igual a uno.

Derechos de autor en trámite Página 69 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

En otra palabras, la probabilidad de que el suceso esperado se cumpla cero vez, una
vez, dos veces, hasta N veces, es igual a uno.
Si graficamos en un sistema de coordenadas un polígono de frecuencias, que
represente la distribución binomial, tenemos:

P (X) P(Np)
... 
... 
... 
... 
P(3) P(3)  P(n-3)
P(2) P(2) |  | P(n-2)
P(1) P(1) | |  | | P(n-1)
P(0) P(0) | | |  | | | P(n)
0 1 2 3 ... Np ... n-3 n-2 n-1 n

Como puede apreciarse de este gráfico, la representación de cada una de las


probabilidades para cada n y un determinado p conforman un “peine” donde están
todas la posibles probabilidades para cada X. El alumno deberá tener presente los
siguientes aspectos:
a) la suma de todas las probabilidades del “peine” tiene que dar 1
b) recordar siempre que p+q = 1, por lo tanto, aunque solo se especifique p, el valor
de q esta automáticamente fijado pues, q = 1 - p

EJERCICIOS DE COMPRENSIÓN

Para terminar de comprender esto a fondo veremos una familia de distribuciones


binomiales en los siguientes gráficos, las probabilidades evolucionan con los
valores de p.

El valor de N = 10 se mantendrá fijo en los siguientes gráficos:

p = variará desde 0,10 hasta 0,90 y, en consecuencia, q = variará desde 0,90 hasta
0,10
X = serán todas las posibles, es decir: 0, 1, 2, ...., hasta 10

La suma de todos los valores de P de cada gráfico totalizan 1


Como puede observarse, las barras comienzan recostadas sobre la izquierda y se
desplazan, simétricamente hacia la derecha.

Derechos de autor en trámite Página 70 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

si p es igual a 0,20
35

30
probabilidad

25

20

15

10

0
0 2 4 6 8 10
valor de las X

si p es igual a 0,30
30

25
probabilidad

20

15

10

0
0 2 4 6 8 10
valor de las X

Derechos de autor en trámite Página 71 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

si p es igual a 0,40
30

25

probabilidad
20

15

10

0
0 2 4 6 8 10
valor de las X

25
si p es igual a 0,50

20
probabilidad

15

10

0
0 1 2 3 4 5 6 7 8 9 10

ÚNICO GRÁFICO DONDE EXISTE SIMETRIA


PUES p = q

si p es igual a 0,60
30

25
probabilidad

20

15

10

0
0 2 4 6 8 10
valor de las X

Derechos de autor en trámite Página 72 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

si p es igual a 0,70
30

25

probabilidad
20

15

10

0
0 2 4 6 8 10
valor de las X

si p es igual a 0,80
35

30
probabilidad

25

20

15

10

0
0 2 4 6 8 10
valor de las X

si p es igual a 0,90
40
35

30
probabilidad

25
20
15

10
5
0
0 2 4 6 8 10
valor de las X

Derechos de autor en trámite Página 73 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Todos estos gráficos constituyen una familia de distribuciones binomiales, en función


de N constante, en este caso igual a 10 intentos, por lo tanto, las veces que
podremos tener éxito van de cero a 10, estas son las X. Las probabilidades de éxito
se han variado de 0,10 a 0,90 lo cual dio origen a la familia de las DISTRIBUCIONES
BINOMIALES.

8.2 DISTRIBUCIÓN DE POISSON

La ley binomial resulta muy laboriosa para el caso de la resolución de la mayoría de


los casos de Control de Calidad, por ello, una buena aproximación es la ley de
POISSON, donde se deberá tener en cuenta algunos supuestos para que la
aproximación sea aceptable.
Estos supuestos son:

N deberá tender a valores muy grandes.


p deberá tender a valores muy pequeños
el producto Np deberá permanecer constante

Estas condiciones, son las más frecuentes en asuntos de Control de Calidad, en


efecto, la muestras, N son siempre grandes, valores cercanos a 100 y superiores casi
siempre a 50. La fracción defectuosa, p, casi siempre es menor al 5% por lo cual la
aproximación resulta siempre muy satisfactoria.

Con estos supuestos la fórmula BINOMIAL :

 N
PX   X
p q
N X

 X

se reduce a:

 Xe  
PX  donde X = 0, 1, 2,...
x!

y  es una constante dada = Np

 otra forma de escribirla sera 

PX 
NpX e  Np
X!

Siendo ambas fórmulas llamadas de POISSON

8.3 RELACIÓN ENTRE LA DISTRIBUCIÓN BINOMIAL Y LA DISTRIBUCIÓN DE


POISSON:

En la distribución binomial, si N es muy grande y la probabilidad p de ocurrencia de


un suceso es muy pequeña, de modo que q = 1 - p es casi 1 se lo denomina un
suceso raro.

Derechos de autor en trámite Página 74 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

En la práctica, un suceso es raro si el número de ensayos es al menos 50 (N  50),


mientras que Np es menor que 5. En tal caso la distribución binomial queda
aproximada muy estrechamente por la DISTRIBUCIÓN de POISSON.

La siguiente tabla muestra las diferencias entre ambas distribuciones:

BINOMIAL POISSON
MEDIA  = Np =
VARIANZA 2 = Npq 2 = 
DESVIACIÓN TÍPICA = = 

Ejercicio de comprensión:

Entre las 2 y las 4 de la madrugada, el número medio de llamadas telefónicas por


minuto que recibe una pequeña central telefónica es de 2,5.
Hallar la probabilidad de que durante un minuto concreto se produzcan:

a) cero llamadas
b) una llamada
c) dos llamadas
d) tres llamadas
e) cuatro llamadas o menos
f) más de seis llamadas

Derechos de autor en trámite Página 75 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

8.4 LA DISTRIBUCIÓN NORMAL, CURVA NORMAL O DISTRIBUCIÓN


GAUSSIANA

Uno de los más importantes ejemplos de una distribución de probabilidad continua es


la DISTRIBUCIÓN NORMAL, también conocida como CURVA NORMAL ó
DISTRIBUCIÓN GAUSSIANA. Está definida por la ecuación :

Donde: µ = media aritmética de la población


y  = desviación típica de la población.

Derechos de autor en trámite Página 76 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

El área total bajo la curva es igual a uno, (o 100%), significa que el 100% de las
probabilidades están representadas por la curva. Consecuentemente, el área bajo la
curva entre X=a y X=b con a < b representa la probabilidad de que X esté entre a
y b . Esta probabilidad se denota por:

Pr{ a < X < b }

VARIABLE CANÓNICA : Z

Esta importante variable Z , se utiliza para transformar la anterior fórmula de Gauss.


La expresión, denominada Unidades Estandard, se define:

Z
X   

Estas unidades Estandard o unidades de Desviación Típica, ( pues está dividido por
sigma ) transforma a la ecuación de Gauss en la siguiente:

1  1 Z2
Y e 2
2

Como se demostrará más adelante, en esta expresión el valor de sigma es igual a


uno, motivo por el cual, desaparece del denominador.

Esta fórmula, que es única, igual para cualquier población, con tal de que calculemos
el valor de Z, tiene la siguiente representación:

CURVA NORMAL DE GAUSS


40
35
PROBABILIDADES

30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
VALORES DE Z

Esta “campana” tiene características peculiares:

Derechos de autor en trámite Página 77 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

a) la media aritmética es igual a cero.

b) el punto de intersección de la perpendicular a la absisa en el valor 1 y -1 con


la curva marca un punto en dicha curva, dicho punto es el punto de inflexión de
la curva, es decir, donde la tangente cambia de signo.

c) la distancia del punto de inflexión a la perpendicular a la absisas en el valor


de X = 0 es el valor de la desviación típica y vale uno.

d) el área dentro de ciertos valores es siempre el mismo según el siguiente


esquema:

Área bajo la curva normal desde MENOS UNA DESVIACIÓN TÍPICA (-1) hasta
MAS UNA DESVIACIÓN TÍPICA (+1)

AREA BAJO LA CURVA NORMAL


IGUAL A 68.27%
40
35
PROBABILIDADES

30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
DESDE -1 A +1 DESVIACION TIPICA

AREA BAJO LA CURVA NORMAL


IGUAL A 95,45%
40
35
PROBABILIDADES

30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
DESDE -2 A +2 DESVIACION TIPICA

Derechos de autor en trámite Página 78 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

AREA BAJO LA CURVA NORMAL


IGUAL A 99,73%
40
35

PROBABILIDADES
30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
DESDE -3 A +3 DESVIACION TIPICA

8.5 RELACION ENTRE LA DISTRIBUCIÓN BINOMIAL y la NORMAL

Si N es grande y si ni p ni q son próximos a cero, las dos distribuciones se


aproximan estrechamente por una distribución normal con variable canónica dada
por:
X  Np
Z
Npq
En el capítulo 8.8, se estudiará la aproximación de la curva normal a los resultados
por la fórmula Binomial.

8.6 EJERCICIOS DE COMPRENSION SOBRE LA DISTRIBUCIÓN NORMAL.

Los siguientes ejercicios, tienen como objetivo aprender el uso de las tablas de
Gauss.

EJERCICIO Nº 1

Hallar el área bajo la CURVA NORMAL en cada uno de los casos siguientes:
a) entre z = 0 y z = 1.20

Derechos de autor en trámite Página 79 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

De tablas leemos que para z = 1,2 es 0,3849, por lo tanto: Pr {0  z  1,2} =


0,3849
Esto significa que el área bajo la curva normal para z entre 0 y 1,2 es del 38.49%

b) Entre z = - 0.68 y z = 0

En tablas se lee para z = 0.68 es 0.2518 por lo tanto,


Pr {-0,68  z  0} =0.2518
Esto significa que el área bajo la curva, para z= -0,68 y z=0 es el 25.18%

c) Entre z = - 0.46 y z 2.21

Derechos de autor en trámite Página 80 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

En tablas se lee que, para z = 0.46 es 0.1772 por lo tanto,


Pr {-0,46  z  0} =0.1772
7Nótese que en la lectura se prescindió del signo menos.
Por otra parte, para z = 2.21 se lee 0.4864. lo cual significa :
Pr {0  z  2.21} =0.4864
Para encontrar el área total debemos sumar ambos resultados:
0.1772+0.4864 = 0.6636
Esto significa que el área bajo la curva, para z= - 0.46 y z=2.21 es del 66.36%

d) Entre z = 0.81 y z = 1.94

Para z = 0.81 es 0.2910 por lo tanto, Pr {0.81  z  0} =0.2910


Para z = 1.94 es 0.4738 esto es : Pr {0  z  1.94} =0.4738
Para encontrar el área entre los dos puntos elegidos, debemos restar ambos
resultados: 0.4738 - 0.2910 = 0.1828
Esto significa que el área bajo la curva, para z= 0.81 y z=1.94 es del 18.28%

e) A la izquierda de z = - 0.6, esto significa, entre z = -  y z = - 0.6

Derechos de autor en trámite Página 81 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Tener presente que desde z = -  y z = 0 la superficie bajo el área es 0.5000 (50%)

Para z = 0.6 es 0.2258 por lo tanto, Pr {0.6  z  0} =0.2258


Para z = -  es 0.5000, esto es : Pr { -   z  0} =0.5000
Para encontrar el área entre los dos puntos elegidos, debemos restar ambos
resultados: 0.5000 - 0.2258 = 0.2742
Esto significa que el área bajo la curva, para z = -  y z=- 0.6 es del 27.42%

f) A la derecha de z - 1.28, esto es ,entre z = - 1.28 y z = + 

CURVA NORMAL DE GAUSS


40

35
PROBABILIDADES

30

25

20
15

10

0
-3 -2 -1 0 1 2 3
Area entre z = -1,28 y z = + infinito

Para z = 1.28 es 0.3997 por lo tanto, Pr {-1.28  z  0} = 0.3997


Para z = 0 y z= + es 0.5000, esto es : Pr {0  z  +} = 0.5000
Para encontrar el área entre los dos puntos elegidos, debemos sumar ambos
resultados: 0.3997+0.5000 = 0.8997
Esto significa que el área bajo la curva, para z = -1.28 y z =+  es del 89.97%

g) A la derecha de z = 2.05, y a la izquierda de z = - 1.44

Derechos de autor en trámite Página 82 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Área total bajo la curva = 1-(área entre-1.44 y 0) - (área entre 0 y 2.05)


1 - 0.4251 - 0.4798 = 0.0951, esto es 9.51%

EJERCICIO Nº 2

Este ejercicio ayuda a entender el uso de los procedimientos anteriores para el


cálculo de las probabilidades en eventos reales.

Se recomienda al alumno dibujar las “campanas” e ir identificando las áreas


escogidas.

Si los diámetros de las bolillas de cojinetes están normalmente distribuidas con media
0.6140 mm y desviación típica 0.0025 mm determinar el % con diámetro :

a) entre 0.6100 y 0.6180 mm


b) mayores que 0.6170 mm
c) menores que 0.6080 mm

Solución:
a)- z = (0.6100-0.6140) / 0.0025 = - 1.60

+ z = (0.6180-0.6140) / 0.0025 = + 1.60

Área solicitada = probabilidad buscada = 0.4452 + 0.4452 = 0.8904

La probabilidad de que el diámetro de las bolillas se encuentren entre 0.6100mm y


0.6180 mm es del 89.04%

b) z = (0.6170 - 0.6140) / 0.0025 = 1.20

Area para z = 0.3849

Area solicitada: 0.5000 – 0.3849 = 0.1151

Derechos de autor en trámite Página 83 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

La probabilidad de que el diámetro de las bolillas sea mayor que 0.6170 mm es del
11.51%

c) z= (0.6080 - 0.6140) / 0.0025 = 2.40

Para z = 2.40, es 0.4918

El área buscada es 0.5000 - 0.4918 = 0.0082

Probabilidad = 0.82 %

Ejercicios en clase:

Se desarrollan ejercicios inversos, dado un área, determinar z.

Ejemplo 1: determinar la nota mínima para el 10% mejor de un curso con media 65 y
desviación típica 9.

Ejemplo 2: Calcular a las cuantas horas deberán cambiarse las ampolletas de


una ciudad, si la vida media es 750 horas y la desviación típica es 35 horas, y
se desea hacerlo cuando falle el 20% de las ampolletas.

8.7 LA DISTRIBUCION HIPERGEOMETRICA.

Esta distribución es Discreta, es una alternativa junto a la Distribución Binomial y


la Distribución de Poisson. Vveamos en que caso nos interesa esta distribución
Discreta.

Cuando la magnitud de la muestra es grande, por lo general, del 20% de la cuantía


del lote (Población), la ley Binomial no puede dar una aproximación satisfactoria de
esta distribución. Teóricamente, la fórmula Hipergeométrica es la distribución finita
correcta. Es decir, la fórmula Binomial nos entrega buenos resultados cuando n es
pequeña en relación a N, pero si no lo es debemos acudir a la relación
Hipergeométrica.
En los casos donde el tamaño de la muestra es significativa frente al tamaño de la
Población , sucede que cada vez que se extrae una unidad del lote , cambia el valor
de p del resto del lote.

Supongamos que se extrae una muestra de 5, de un lote de 20 unidades, que tiene


2 unidades defectuosas, esto es p’ = 0,10 , la magnitud de la muestra es de 25% del
lote.

La fórmula de la Distribución Hipergeométrica es la siguiente:

Derechos de autor en trámite Página 84 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

 L  d  d
  
 c   n  c   c
P  
n  L
 
 n
L = Tamaño del Lote (Población)
d = Unidades defectuosas en el Lote
n = tamaño de la muestra.
c == Unidades defectuosas en la muestra.

Esta fórmula se interpreta así: la probabilidad de que una muestra al azar, de n


unidades , contenga c unidades defectuosas, para un tamaño de lote (Población) L
en el cual existen d unidades defectuosas.

Nos preguntamos la probabilidad para c= 0, 1 y 2, los resultados serán:

Para c = 0

Para c = 1
 20  2  2
  
1
   5  1   1
P    0.395
5   20
 
 5

Para c = 2

 20  2  2
  
 2  5  2   2
P    0.053
5  20
 
 5

En la siguiente figura, se ha graficado los tres resultados obtenidos, y también se


muestra los resultados para el mismo caso, resueltos con la fórmula Binomial, y por
Poisson.
Naturalmente, el cálculo Hipergeométrico, muestra valores solo para c= 0, 1 y 2, ya
que el número máximo de defectos posibles en la muestra de 5 es 2.

Derechos de autor en trámite Página 85 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Tanto el método Binomial como el de Poisson suponen magnitudes de lotes infinitas,


y cuando se llevan a los límites de la expansión, producen valores de probabilidad
para defectos 3, 4 y 5 de la muestra. Esto no tiene sentido en este ejemplo ya que no
existen.

Téngase presente que de los tres resultados, los únicos correctos son los de la
Hipergeométrica, y en los otros datos puede apreciarse el grado de error con los
resultados correctos.

Problema:

En una editorial, en la producción de un determinado tipo de libro, se espera una


probabilidad de 0.10 de encontrar un error en una hoja de los mismos. Para la
impresión de un libro de 70 hojas deseamos conocer, al revisar 3 hojas al azar, que
probabilidad existe de encontrar ninguna hoja con error.

Solución:

L = 70 n=3 p = 0,10
d=7 c=0

 70  7  7
  
 0  3  0   0
P    0.7254
 3  70
 
 3
Respuesta: 72.54 %

Derechos de autor en trámite Página 86 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

8.8 APROXIMACION NORMAL A BINOMIAL

La aproximación normal a Binomial es sencilla, siempre que n no sea grande,


ejemplo:

Para: n = 12 y p = 1/3

La familia binomial tiene las siguientes probabilidades:

P(0)=0.008 P(4)=0.238 P(8) =0.015 P(12) = 0.000


P(1)=0.046 P(5)=0.191 P(9) =0.003
P(2)=0.127 P(6)=0.111 P(10)=0.000
P(3)=0.212 P(7)=0.048 P(11)=0.000

Conceptualmente, la gráfica para una distribución Binomial, deberá representarse,


como se vio anteriormente como una “peineta”, es decir, líneas verticales desde el
valor encontrado a la abscisa, pues entremedio no existen valores. Sin embargo, para
los fines comparativos con la normal, recurriremos a un histograma. Es decir, las
barras indicarán los valores obtenidos con la fórmula Binomial, pero nos dará también
una idea de superficie, de manera que podamos acercarnos, visualmente, a la curva
normal.

0,238
0,212
0,191

0,127
0,111

0,046 0,048

0,008 0,015
0,0030

0 2 4 6 8 10 12
Distribución binom ial para p=1/3 y n=12

En 8.1, definimos que, para la distribución Binomial es:

Derechos de autor en trámite Página 87 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

La curva normal, superpuesta, tiene los datos calculados con la fórmula anterior:
resulta evidente que existe una buena aproximación, pese a que n es solo 12.

0 2 4 6 8 10 12
Distribución binomial para p=1/3 y n=12, con curva
norm al superpuesta

Para verificar este acercamiento, realicemos los siguientes ejercicios:

Si la probabilidad de que un tirador acierte a un blanco es de 1/3, y si dispara 12 tiros,


¿cuál es la probabilidad de que acierte por lo menos 6 de ellos?

La respuesta exacta, a tres decimales, es P(6) + P(7) + P(8)+......+ P(12) = 0.177

Geométricamente, esta respuesta, es el área de aquella parte del histograma, a la


derecha de x = 5.5

Por lo tanto, al aproximar esta probabilidad por los métodos de la curva normal, se
necesita encontrar el área bajo la curva normal, a la derecha de 5.5.

Puesto que la curva normal, fue construida con  = 4 y  = 1.63 se sigue que:

x -  5.5  4
z   0.92
 1.63

De tablas encontramos que para z=0.92, el área correspondiente es 0.179, y esto es


una buena aproximación al 0.177 calculado por la fórmula Binomial. Téngase
presente que el valor correcto es el que se calculó por la fórmula Binomial.

Derechos de autor en trámite Página 88 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Comprobemos ahora para otro caso.


Calcular la probabilidad de que el tirador acierte precisamente 6 tiros en 12.
De lo calculado al principio del capítulo, la respuesta correcta, a 3 decimales es
0.111.

Por Gauss, la respuesta la da el área bajo la curva normal entre 5.5. y 6.5.

6.5  4
z2   1.53 A 2 0.4370
1.63

5.5  4
z1  = 0.92 A 1 0.3212
1.63

Restando una de otra área, el resultado es : 0.116, que, comparada con 0.111
también es una buena aproximación.

Si utilizamos la fórmula de 8.1 podremos averiguar z con la siguiente expresión:

x  np
z
npq

A la expresión np se le llamó valor más probable y es el equivalente de la media


aritmética de una distribución continua. Por otra parte, np, representa el número de
éxitos más probables, esto es x¸ si dividimos por n tanto x como np nos da la
proporción de éxitos, (en Control de Calidad, lo llamaremos fracción defectuosa),
de tal forma, la fórmula anterior se expresa como sigue:

x
p
z n
pq
n

Es decir que, cuando los datos son entregados en la forma de proporción de éxitos, o
fracción defectuosa, la curva normal de aproximación, será la que se obtiene
utilizando
p
y
pq
 
n

Estas fórmulas serán de utilidad más adelante.

8.9 Ejercicios de Aplicación.

Derechos de autor en trámite Página 89 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico

Capítulo 7
Distribución Binomial: 7.1, 7.2, 7.3, 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 7.42, 7.43, 7.40,
7.44.
Distribución Normal: 7.14, 7.15, 7.16, 7.17, 7.18, 7.20, 7.21, 7.22, 7.23, 7.49, 7.50,
7.51, 7.52, 7.54, 7.57, 7.58.
Aproximación normal a binomial: 7.24, 7.25, 7.26.
Distribución de Poisson: 7.27, 7.28, 7.29, 7.67, 7.68, 7.71

Derechos de autor en trámite Página 90 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capitulo 9
Correlación y Regresión

9.1 Introducción

Si mediante procedimientos estadísticos, y basándonos en datos históricos,


procedemos a predecir información futura, estamos realizando un ANÁLISIS DE
REGRESIÓN.
Por ejemplo, con la información de las ventas, estacionarias de los tres últimos años,
podemos PREDECIR las ventas futuras para los mismos períodos. Otro caso, de
acuerdo con las notas obtenidas por un alumno en la enseñanza básica, podríamos
PREDECIR los resultados académicos en la Universidad. En ambos casos
estaríamos aplicando técnicas de REGRESIÓN.
Rápidamente puede advertir, el alumno, las dificultades del método. En el primer
caso, la probabilidad de que la predicción sea buena, depende de que no hallan
cambios en el escenario de donde se obtuvieron los datos históricos. Si para este
año, tenemos un nuevo competidor en el mercado, todos los datos históricos no
serán de la misma utilidad y los resultados serán inciertos. En el segundo caso, es
sabido que los estudiantes tienen un marcado cambio en su pasaje de la Básica a la
Universidad, las razones son múltiples, distinto grado de adaptación a los nuevos
métodos de enseñanza, cambios biológicos importantes, motivaciones distintas,
madurez intelectual, etc., Por lo tanto la predicción, en éste caso, hay que tomarla
con reservas.

Ahora bien, aunque las dificultades existen, el método es matemáticamente muy


bueno, y además los cambios del escenario también pueden de alguna manera
considerarse, de manera que es una herramienta valiosa para Marketing, la Gestión
de Compras, Control de Calidad, etc.
Luego de este ANÁLISIS DE REGRESIÓN, nos queda el problema de saber que
tan bueno es el ajuste entre las distintas variables, esto significa conocer que tan
bueno es el ajuste entre las variables.
Es decir, el ANÁLISIS DE CORRELACIÓN, nos dice con que precisión nos están
informando la predicción.
Por ejemplo, un problema de correlación puede ser, ¿existe relación entre el
consumo del tabaco y las muertes por afecciones cardíacas? ¿Entre la recepción de
radio y la actividad de las manchas solares? ¿entre la belleza y la inteligencia?.
Por ejemplo, la correlación entre el consumo de tabaco y las muertes por afecciones
cardíacas es elevada, esto quiere decir que, conociendo el consumo de tabaco,
podemos hacer una buena predicción de la probabilidad de muerte temprana por
afección cardíaca.

9.2 Análisis de Correlación

Con la finalidad de ilustrar la manera en que se procede a estudiar la relación entre


dos variables, consideremos los datos de la siguiente Tabla, que consiste en las
notas de 30 estudiantes en una prueba de lenguaje y una de ciencias.

Derechos de autor en trámite Página 91 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

La nota máxima era de 50 puntos

x y x y x y x y x y x y
34 37 28 30 39 36 35 35 33 31 34 32
37 37 30 34 33 29 29 36 32 31 36 38
36 34 32 30 30 29 34 37 33 36 34 31
32 34 41 37 33 40 35 39 37 40 38 40
32 33 38 40 43 42 36 40 36 42 31 29

La investigación de la relación entre las dos variables comienza, generalmente, con


un intento de descubrir la forma aproximada de la relación, trazando los datos como
puntos en el plano x,y
Esta gráfica recibe el nombre de DIAGRAMA DE DISPERSIÓN. Esto nos da una
aproximación visual a la posible relación.

45
43
41
Notas de ciencias

39
37
35
33
31
29
27
25
25 27 29 31 33 35 37 39 41 43 45
Notas de lenguaje

Una simple inspección visual, nos sugiere que existe una razonable relación entre los
puntos, la nube sugiere una tendencia a crecer, es decir, a mejores notas en
ciencias, mejores notas en lenguaje, y viceversa. Esta “sugerencia” es la
CORRELACIÓN, y nuestro interés ahora es medir esa relación entre los valores.
Por otra parte, el aspecto general del diagrama de dispersión, es el de una línea
recta. Para determinar la naturaleza de una tendencia, se busca cualquier propensión
de los puntos de agruparse sobre ambos lados de alguna curva simple o bien a
ambos lados de una línea recta. Para estas variables seria conveniente poder medir
en alguna forma el grado en que ambas variables se encuentran relacionadas
linealmente. Con el objeto de obtener esta medida, considérense las propiedades
que seria conveniente que tuviera.
Una medida de la relación tendrá que ser independiente de la elección del origen
para las variables. Esta propiedad puede obtenerse usando las desviaciones de las
variables mismas. Esto es igual a la definición de la Desviación Típica.

Así, se usan las variables xi  X e yi  Y en lugar de las variables xi e yi para


formar la medida de relación deseada.
La notación xi , yi denota el i-ésimo número de nuestra tabla.
También deberá ser independiente de la escala de medidas empleada para x e y.
Esta propiedad puede obtenerse dividiendo x entre cantidades que posean las
mismas unidades que x e y. Esto se logra dividiendo por la DESVIACIÓN TÍPICA.
Esto significa que lo reducimos a UNIDADES ESTANDARD o sea a la variable Z.
De esta forma describiremos ahora dos variables ui y vi siendo,

Derechos de autor en trámite Página 92 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

ui 
x  X
i
y vi 
y  Y
i

x y
Con estas variables podemos volver a representar el diagrama de dispersión. Este
será ahora un DIAGRAMA DE DISPERSIÓN PARA VALORES NORMALIZADOS.
Las coordenadas se cortan en un punto central del diagrama, pero el perfil de la nube
de puntos, continua siendo exactamente el mismo

0
-3 -2 -1 0 1 2 3
-1

-2

-3

Se puede ver, que la mayoría de los puntos se encuentran en los cuadrantes 1 y 3.

Este comportamiento sugiere una relación entre las variables, una medida simple de
esta relación es la siguiente:
n

uv
i1
i i

Los términos de la suma correspondiente a los puntos en los cuadrantes 1 y 3 serán


siempre positivos mientras que los del cuadrante 2 y 4 serán negativos y restaran a la
sumatoria.
Consecuentemente un valor positivo elevado tenderá pues a indicar una tendencia
lineal pronunciada en el diagrama de dispersión. Esto sin embargo no es
estrictamente cierto, ya que si el número de puntos se duplicara sin cambiar la
naturaleza de la dispersión, el valor de la suma se casi duplicaría . Es pues,
necesario dividir la suma entre n antes de usarla como medida de la relación.
Existen razones teóricas para preferir n-1 en lugar de n .

El resultado es  uv , esto es la medida deseada y se llama


COEFICIENTE DE
n1
CORRELACIÓN. Este coeficiente se denota con la letra r. Si se reemplaza por las
medidas originales la expresión es la siguiente:

 x i 
 X yi  Y 
r i 1

n  1sx sy
El resultado de esta ecuación es un número que va desde cero a uno, siendo, cero,
la inexistencia de correlación, y uno la correlación total.

Es decir que r toma valores según la siguiente relación:

Derechos de autor en trámite Página 93 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

0 r 1

Si la tendencia del diagrama es a decrecer, es decir si la nube de puntos sugiere que


los valores tienden a decrecer, en lugar de crecer como sucede en el ejemplo de las
notas que se dio al comenzar este tema, entonces, r toma valores entre 0 y -1,
indicando con cero, otra vez, la inexistencia de correlación, y con -1 la absoluta
correlación.

Nótese, que en realidad, cuando la tendencia de los puntos, es a decrecer, se puede


modificar dicha tendencia, mediante un simple cambio de ejes. Por esta razón, el
alumno, debe fijar, como concepto que r toma valores entre 0 y 1.
Cuando es r = 1, significa que son puntos todos sobre una línea recta. Cuando r = 0
son puntos totalmente dispersos que no guardan entre sí ninguna relación.

Si se calcula r para la tabla de los estudiantes nos da como resultado

r = 0.66

Este resultado indica que existe correlación, aunque mas bien pobre, es decir,
que no necesariamente, los alumnos que tengan buenas notas en lenguaje
tienen que tener buenas notas en ciencias y viceversa. Lo mismo ocurre con
los alumnos con malas notas.
Una buena correlación que nos da oportunidad de pasar al análisis de regresión, es
cuando r supera 0.80. Por supuesto, esto es una sugerencia, el analista es el que
determina el nivel de riesgo con el cual desea trabajar. La regresión es siempre
posible hacerla aunque r sea igual a valores muy bajos cercanos a cero. Lo que
sucede, en estos casos, es que las predicciones no se cumplen.

CALCULO DE r

La fórmula dada para definir a r no siempre es conveniente para fines de cálculo. Se


obtiene una forma mejor multiplicando factores, insertando valores para Sx y Sy,
empleando algo de álgebra, con los siguientes resultados:

Esta última fórmula, (de no ser necesarias las medias aritméticas de x e y), tiene la
ventaja de que solo se requieren las sumas de: x e y, sus cuadrados y sus
productos.

Derechos de autor en trámite Página 94 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

9.3 Análisis de Regresión

Como lo sugiere el estudio anterior, la regresión, consiste en reemplazar, la “nube de


puntos”, por una recta que mejor se ajuste, mediante la cual, podremos leer datos, en
lugares donde la información no existía. es decir, que podremos predecir.
Con el objeto de explicar los métodos de Regresión, considérense el problema
particular de predecir el rendimiento de pasto, como función de la cantidad de agua
de irrigación aplicada.

Los datos de la tabla representan la cantidad, en centímetros cúbicos, de agua


aplicada y el rendimiento en toneladas de forraje del terreno de una granja
experimental.

La gráfica de estos datos se ilustra en la figura.

Agua (x) 12 18 24 30 36 42 48
Rendimiento (y) 5.27 5.68 6.25 7.21 8.02 8.71 8.42

5
12 18 24 30 36 42 48

.
En éste gráfico, resulta que x e y están relacionados en forma aproximadamente
lineal, para ésta clase de valores de x.

Por ello, una línea recta podrá ser aplicada a éste grupo de puntos para PREDECIR
los valores de y partiendo de x .

El procedimiento para trazar la línea recta, partiendo de los datos, se denomina


MÉTODO DE LOS CUADRADOS MÍNIMOS. La recta pasará por los puntos que
mejor se ajusten a los datos disponibles, esto es, por los puntos donde las distancias
a los datos sean menores.

Método De Los Cuadrados Mínimos

Por todo lo visto en los párrafos anteriores, la predicción se reduce al problema de


ajustar una línea recta a un grupo de puntos.

Derechos de autor en trámite Página 95 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Ahora bien, la ecuación de la recta se escribe en la siguiente forma:

y = a + bx

en donde a y b son los parámetros que determinan la recta.

Así pues:

y = 2 + 3x

e y = 4 - 2x representan:

16 y=2+3x
y=4-2x
11

1
-7 -4 -4-1 2 5 8

-9

Puesto que el problema es determinar los valores de los parámetro a y b de manera


que la recta coincida satisfactoriamente con un juego de puntos, el problema es
esencialmente la estimación de los parámetros a y b de alguna manera eficiente.

El método más conocido es el de los MÍNIMOS CUADRADOS.

Puesto que la recta deseada se va a usar para objetivos de predicción es razonable


el requerir que la recta sea tal que hagan pequeños los errores de predicción.

Por error de predicción se entiende la diferencia entre un valor observado de y , con


el valor correspondiente de línea recta para y.

Por ejemplo, el valor de predicción en el ejemplo visto al comienzo de este tema, para
x= 30 es, aproximadamente igual a 7.21 - 7.00 = 0.21

Si se hubiera empleado una recta diferente para la predicción, el error sería otro.

Lo que se busca es hacer mínimo la suma de los cuadrados de los errores y se


determina lo que se conoce como la línea recta mejor ajustada en el sentido de los
mínimos cuadrados.

Resulta claro que variando a y b de la ecuación de la recta, podremos encontrar la


recta que mejor se ajuste a los puntos de la figura vista al comienzo de este capítulo..

Derechos de autor en trámite Página 96 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Sin embargo, lo necesario es lograrlo mediante un proceso racional sistemático y es


aquí donde interviene el principio de los MÍNIMOS CUADRADOS. La deducción de
los coeficientes de la recta de regresión está fuera del alcance de nuestro curso, por
lo cual solo se las enunciará de la siguiente manera:

RECTA DE REGRESIÓN : y = a + bx

donde el término constante a y el coeficiente de regresión b se calculan según las


siguientes fórmulas:

Término constante de la fórmula de regresión: a   y  b x


n

n xy   x y
Coeficiente de regresión de la fórmula de Regresión: b 
  x 
2
n x 2

Comentarios acerca del coeficiente de regresión y de la recta de regresión

Cuando vimos el coeficiente de regresión dijimos que si la tendencia de la nube de


puntos era creciente, r varia de 0 a 1, y que si la tendencia era decreciente r
varía de 0 a -1.
Ahora podemos especificar mejor este punto, si la pendiente de la recta de
regresión es positiva r varia de 0 a 1, y si la pendiente es negativa r varia de
0 a -1.

Nota importante: si la recta de regresión resulta paralela al eje de las x, r es


NULO.

9.4 Ejercicio de Aplicación.

El siguiente ejercicio sirve para realizar todos los cálculos vistos y además utilizar la
recta para hacer algunas predicciones.

Con la siguiente serie de datos calcular el valor del COEFICIENTE DE


CORRELACIÓN, calcular los COEFICIENTES DE LA RECTA DE REGRESIÓN Y
PREDECIR en tres puntos fuera de los valores registrados.

Derechos de autor en trámite Página 97 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

X Y X2 XY Y2
65 68 4225 4420 4624
63 66 3969 4158 4356
67 68 4489 4556 4624
64 65 4096 4160 4225
68 69 4624 4692 4761
62 66 3844 4092 4356
70 68 4900 4760 4624
66 65 4356 4290 4225
68 71 4624 4828 5041
67 67 4489 4489 4489
69 68 4661 4692 4624
71 70 5041 4970 4900

X=800 y=811 X2=53418 XY=54107 Y2=54849

Calculo del coeficiente de correlación

r
1254.107  800811  0.7027
1253.418  8002 1254.849  8112 

Calculo del coeficiente de regresión de la fórmula de regresión:

b
1254.107  800811  0.4764
1253.418  8002

Cálculo del Término constante de la fórmula de regresión:

a
811  0.4764800  35.82
12

Diagrama de dispersión y recta de regresión

Derechos de autor en trámite Página 98 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

71
70
69
68
67
66
65
62 64 66 68 70 72

Ecuación de la recta: y = a + bx = 35.82 + 0.48 x

Predicción para los valores de x fuera de los datos registrados:

VALORES DE X PREDICCIÓN PARA Y


50 60
85 77
90 79

9.5 Ejercicios de Aplicación.

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico

En este curso solo se ha visto la regresión de y sobre x, por ello, de los


problemas sugeridos, el alumno solo deberá resolver según lo visto en clase.

Capítulo 13 : 13-8, 13-10, 13-19, 13-20, 14.40, 14.46, 14.47

Derechos de autor en trámite Página 99 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 10
10 Teoría del muestreo

10.1 Muestreo aleatorio

En todas las discusiones referentes al muestreo y a las distribuciones de frecuencias


de muestras siempre se supuso que las muestras se escogían al azar, esto es que el
muestreo era aleatorio.
En términos de probabilidad, esto implica que la probabilidad de que un cierto
miembro cualquiera sea escogido es igual a 1/N donde N es el número total de
individuos de que consta la población.

10.2 Distribución de muestreo

Matemáticamente, y por la teoría de probabilidades, puede demostrarse que la


distribución de X poseerá una distribución normal, si es que X la posee, con el
mismo promedio que X, pero con una desviación típica que es veces la
desviación típica de X. (n es el tamaño de una muestra seleccionada de entre N).
Estos resultados matemáticos se expresan en la forma de un teorema:

TEOREMA UNO: Si X posee una distribución normal cuyo promedio es  y cuya


desviación es , entonces el promedio de muestra X en una muestra al azar de
tamaño n, poseerá también una distribución normal cuya media será  y cuya
desviación típica será

En base a este teorema consideremos el siguiente problema:

Sea X la representación del peso de un individuo seleccionado al azar de una


población de varones adultos. Supóngase que X posee una distribución normal
teórica cuyo promedio  = 68 kg. y  = 3 Kg. Lo que se quiere resolver es lo
siguiente: si se toma una muestra al azar de tamaño n = 25 para esta población,
¿cual es la probabilidad de que el promedio de la muestra X se encuentre dentro del
intervalo 67 - 69 kg.?

El teorema señala que la media poseerá una distribución normal con :

3 
X = 68 y  X  0.6  
25 n

En el siguiente gráfico podemos ver las dos distribuciones, la primera, con trazo
delgado, es la distribución de las X, la segunda, con trazo grueso, es la distribución
de las medias, en el primer caso, la desviación típica vale 3 Kg. y en el segundo
caso, vale 0.6, de acuerdo con los cálculos vistos más arriba.
Por otra parte, el tamaño de la muestra que se consulta es, n es igual a 25.

Derechos de autor en trámite Página 100 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

El problema de calcular la probabilidad de que X se encuentre dentro del intervalo


67 a 69 se resuelve ahora fácilmente utilizando la fórmula :

Z1 = (67-68) / 0.6 = - 1.67 y Z 2 = (69-68) / 0.6 = + 1.67

Según las tablas es 0,4525 + 0,4525 = 0,9050 es decir , la probabilidad de que X


se encuentra entre 67 y 69 es del 90,5%.
Supongamos ahora que la variable X no posea una distribución Normal.
El resultado es que si n es mayor que 25 la distribución de X , parecerá normal
independientemente de la distribución de población que se elija para X.

TEOREMA DOS: (Llamado del límite central) Si X posee una distribución con
promedio  y desviación típica , entonces el promedio de muestra X basado en
un muestreo al azar de tamaño n, poseerá una distribución normal aproximada con
promedio  y una desviación típica : , cuya aproximación se hace cada vez
mejor al crecer n
Esto es válido para variables continuas ó discretas. Veamos un ejemplo para una
variable discreta que puede tomar los valores 1 a 6 con probabilidades según el
siguiente gráfico.
Distribución No Normal

Derechos de autor en trámite Página 101 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

0,25

0,2

0,15

0,1

0,05

0
1 2 3 4 5 6

Esta distribución tiene una media aritmética = 2.75 y una desviación típica igual a
1.48
De esta población, supongamos de 1000 unidades, sacaremos 100 muestras, (con
reposición) de 10 unidades cada una, se obtuvo el siguiente resultado real:

Clases X Tildes Frecuencias


1.5 - 1.6 1.55 / 1
1.7 - 1.8 1.75 0
1.9 - 2.0 1.95 // 2
2.1 - 2.2 2.15 ///// // 7
2.3 - 2.4 2.35 ///// ///// /// 13
2.5 - 2.6 2.55 ///// ///// ///// / 16
2.7 - 2.8 2.75 ///// ///// ///// //// 19
2.9 - 3.0 2.95 ///// ///// ///// / 16
3.1 - 3.2 3.15 ///// ///// //// 14
3.3 - 3.4 3.35 ///// //// 9
3.5 - 3.6 3.55 / 1
3.7 - 3.8 3.75 // 2
Total 100

El histograma para este diagrama de frecuencias es el siguiente:

20

15

10

0
1,55 1,75 1,95 2,15 2,35 2,55 2,75 2,95 3,15 3,35 3,55 3,75

Derechos de autor en trámite Página 102 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

De donde se desprende por cálculo, a partir de la distribución de frecuencias


obtenida, que X = 2.77 y la desviación típica de la población de muestreo es
0.41

Los valores teóricos son :

 X    2.75
y
 1.48
x    0.47
n 10

Por lo tanto vemos que se cumple: a) una muy buena aproximación de los valores
teóricos a los prácticos, y b) que el perfil de la distribución de las medias se parece a
una normal, pese a que la distribución de las X es lo menos parecido a una normal.

10.3 Muestreo de Poblaciones Pequeñas

En todos los cálculos anteriores se ha supuesto que la población era suficientemente


grande como para que la extracción de la muestra no afectara los resultados, Pero, si
la población es pequeña, esta presunción no es correcta, y debemos corregir de la
siguiente manera:

Si N indica el tamaño de la población que se muestrea y n denota el tamaño de la


muestra que se toma sin reposición, entonces puede demostrarse que la fórmula :


X 
n

Se sustituye por la siguiente


 N n
X 
n N1

Para ver el efecto que el factor de corrección tiene, haremos un ejercicio


considerando los tamaños de muestra de población para los cuales:

a) n = 5% de N b) n = 10% de N c) n = 20% de N

Puesto que rara vez tiene objeto tomar muestras de poblaciones menores de 100, y
puesto que N - 1 diferirá de N por menos del 1%, entonces, el factor de corrección
se puede simplificar así:

5 10 20
a) 1  0.97 b) 1  0.95 c) 1  0.89
100 100 100

Con estos resultados, es conservadora la conclusión de que la fórmula original,



X  se encontrará dentro de un error inferior al 10% a menos que la muestra
n
constituya el 10% o más de la población.

Derechos de autor en trámite Página 103 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Como recomendación final sería: usar la fórmula original mientras que la muestra sea
menor que el 10% con respecto a N, y la fórmula corregida desde el 10% para arriba.

10.4 Distribución de Muestreo de Proporciones.

El mismo factor de corrección, visto en el párrafo anterior, puede aplicarse a la


desviación típica de las proporciones, cuando el tamaño de la población es lo
bastante pequeño como para justificarlo.

Las fórmulas vistas en el capítulo correspondiente para las distribuciones discretas,


esto es, las distribuciones binomiales, nos enseño que el valor más probable es np
(Nótese que éste valor más probable, es el equivalente a la media aritmética de las
distribuciones continuas), siendo n el tamaño de las muestras y p la fracción
defectuosa, es decir la proporción de defectos que tiene la muestra, el producto
indicado, es decir un número discreto, por esto en Control de Calidad a los gráficos
np se les llama gráficos de defectuosos, porque son las unidades con uno o más
defectos que encontramos durante las inspecciones. En ese contexto, la desviación
típica fue definida cómo: . De acuerdo con esto podremos deducir fácilmente
las fórmulas correspondientes a la proporción p dividiendo ambas expresiones por n,
con lo cual np queda reducido a p y la desviación típica que era quedará

como : , nótese que al dividir por n entra dentro de la raíz como n al cuadrado.

Ahora, basándonos en las anteriores demostraciones, podemos hacer extensiva la


correspondiente fórmula, para las proporciones:

10.5 Distribución de muestreo de diferencias y sumas.

Supongamos tener poblaciones de tamaño N1 y N2 , para cada muestra n 1 y n2


calculamos los correspondientes estadísticos S1 y S2 . Esto nos da, una población de
muestreo para ambos estadísticos, (nótese que por estadísticos estamos
suponiendo cualquier parámetro que estamos controlando, como la media aritmética
o la desviación típica, o cualquier otra cosa).
Las dos poblaciones de muestreo tendrán en consecuencia una media del muestreo
y una desviación típica, también de los datos del muestreo. Estas estarán denotadas
por : s1 , s2 , s1 y s2 .

De todas las posibles combinaciones, podremos obtener una distribución de


muestreo para las diferencias de los estadísticos. La media y la desviación típica de
esta distribución de muestreo, se escribe como :

s1-s2 = s1 - s2 y

Para que se cumplan estas condiciones, las muestras seleccionadas no deberán


tener dependencias entre ellas, es decir, deberán ser necesariamente independientes
entre sí.

Derechos de autor en trámite Página 104 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Si S1 y S2 son las medias muestrales de ambas poblaciones, cuyas medias


escribiremos , entonces la distribución de muestreo de las diferencias de
medias viene dada por:

Estas fórmulas son válidas para muestreo de poblaciones infinitas o con reposición.

Los mismos resultados los obtenemos para distribuciones de muestreo de diferencias


de proporciones de dos poblaciones binomialmente distribuidas con parámetros
(p1,q1) y (p2, q2) respectivamente. En este caso las fórmulas se expresan como sigue:

Todos los desarrollos vistos sirven para el caso de la suma en lugar de la resta, así
para el primer caso tendríamos:

Esta fórmula es de uso frecuente y de gran utilidad en el área de Control de Calidad


Estadístico.
Nótese que para la desviación típica el resultado de la suma es el mismo que para la
diferencia.

10.6 Ejercicios de Aplicación.

Ejercicio 1

Si la desviación típica de las estaturas de niños de primer grado es de 5 cm, ¿cuál es


la probabilidad de que la estatura promedio de una muestra al azar de 100 de estos
niños difiera en más de un cm, con respecto a la estatura promedio para todos los
niños?

Desarrollo:

Supondremos que N (desconocido) es muy grande:

Si la desviación típica es 5 cm será:

Derechos de autor en trámite Página 105 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Para z = 2, el área bajo la curva normal es igual a: 0,4772


Entonces, el área bajo la curva normal, entre –2 y +2, esto es, entre -1 y +1
alrededor de la media, será 0,4772 * 2 = 0,9544

Pero ésta será la probabilidad de que se encuentre entre los límites dados, la
pregunta lo solicita fuera de dichos límites.

La respuesta será 1,0000 – 0.9544 = 0,0456

Esto significa una probabilidad de 4,56 %

Ejercicio 2

En el mismo ejercicio anterior supondremos que N = 500

En este caso, n = 100 es el 20% de N, por lo tanto usaremos la fórmula


correspondiente:

Para este valor de z, la probabilidad de que se encuentre entre +1 cm y –1cm es del


98,68% y de que se encuentre afuera, del 2.64 %

Ejercicio 3

Hallar la probabilidad de que en los próximos 200 nacimientos a) menos del 40%
sean niños, b) entre 43% y 57% sean niños, c) más del 54%
Se deberá suponer que las probabilidades de nacimiento de niño o niña serán del
50%.

a) p = 0,50 y q = 050, Además N es muy grande

 = P = 0,50

Derechos de autor en trámite Página 106 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Para este valor de z, la tabla nos da un área de 0,4977, por lo cual, el área
correspondiente a menos de 40 % será: 0,500 – 0,4977 = 0,0023

Respuesta: 0.23 %

b) en este caso tenemos que hacer dos cálculos:

El área correspondiente será de 0,4761 * 2 = 0,9522

Respuesta: 95,22%

c)

El área correspondiente a z = 1.13 es 0,3708.


Pero nos preguntan lo que supera a ese valor, es decir más de 54%, por lo tanto hay
que restarlo de 0,5000.

0,5000 – 0,3708 = 0,1292

Respuesta: 12,92%

Ejercicio 4

Dos distancias se han medido como 27.3 cm y 15.6 cm con desviación típica de
0,16 y 0,08 cm, respectivamente. Hallar la media y la desviación típica de a) la
diferencia y b) la suma de esas distancias.

Solución:

a) d1 –d2 = d1 - d2 = 27.3 – 15.6 = 11.7 cm

Derechos de autor en trámite Página 107 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

b) d1 +d2 = d1 + d2 = 27.3 + 15.6 = 42.9 cm

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico.

Capítulo 8

Ejercicios 8.1, 8.2, 8.3, 8.4, 8.7, 8.11, 8.16, 8.21, 8.23, 8.24, 8.25, 8.26,
8.27, 8.34, 8.39, 8.40.

Derechos de autor en trámite Página 108 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 11
11 Intervalos de confianza

11.1 Estimación por punto y por intervalo

Uno de los usos más frecuentes de la estadística, es la ESTIMACIÓN de


propiedades de la población.
Las dos distribuciones de frecuencias de poblaciones que se han estudiado han sido
la Binomial y la Normal, por lo tanto, consideraremos sus propiedades.

La Distribución Binomial,
 N
PX    p X qN X
 X
queda completamente determinada por el número de intentos n, y la probabilidad de
éxito en una sola prueba p.

Los símbolos n y p se llaman Parámetros de la distribución.

Recordemos la diferencia entre Estadísticos y Parámetros, el primero se refiere a


los medidores de la distribución de una muestra, y el segundo a los medidores de la
distribución de la población. En las consideraciones siguientes hablaremos de
parámetros pues estamos estudiando las propiedades de toda la población que nos
interesa. Los parámetros n y p determinan completamente la distribución binomial y,
consecuentemente, cualquier propiedad de la distribución.

La DISTRIBUCIÓN NORMAL queda completamente determinada por los dos


parámetros  y  .

Curva Normal de Gauss

        

Derechos de autor en trámite Página 109 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Los problemas de estimación para problemas normales pueden reducirse


generalmente a los problemas de estimación de  y .

Existen dos tipos de estimaciones de parámetros . Uno es la estimación por punto y


la otra es la estimación por intervalo.

Una estimación por punto es lo habitual, esto es el número que se obtiene por
cálculo a partir de los valores de la muestra y que sirve como aproximación al
parámetro que se está estimando.

Una estimación por intervalo, para un parámetro es un intervalo determinado por


dos números que se obtienen a partir de cálculos de valores de muestras que se
espera contengan el valor del parámetro en su interior. La estimación por intervalo se
construye de forma tal, que la probabilidad de que el intervalo contenga al parámetro
puede especificarse. Tales estimaciones por intervalo se llaman “INTERVALOS DE
CONFIANZA”

11.2 Intervalo de confianza

Partiremos el estudio de estos intervalos, utilizando las propiedades de la Distribución


Continua llamada Curva Normal, luego de lo cual, extenderemos los conceptos, a la
distribución discreta o Binomial.
Supongamos que se trata de estimar la media X de cierta característica de calidad
de un lote de N unidades. Para ello extraemos una muestra de n unidades y
determinamos los valores X1, X2, ...,Xn
El siguiente diagrama representa una interpretación de lo que se esta tratando:

X 1 XN X4  X3 X2
------------------------------------I---I-----I------I-------I----------I--I--I-------------------->
I1 0 I2 eje de las X

Supongamos tener n datos X de una muestra extraída de una población N, de los


cuales en el eje de las X hemos ubicado los 4 primeros datos y el último dato, estos
son X1 , X2 , X3 , X4 y Xn , está implícito que sobre este eje estarán todos los datos de
la muestra.
La media aritmética de esta muestra es la cual fue ubicada en un lugar central de
los datos escritos. Por todo lo explicado hasta ahora, la media de la población, 
estará cerca del valor anterior pero, probablemente, no coincidirá con el valor
anterior. En el gráfico, lo hemos escrito a la derecha de .

Derechos de autor en trámite Página 110 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Ahora bien, llamaremos INTERVALO DE CONFIANZA, a una distancia desde la


media aritmética de la muestra hasta I1 e I2 , de tal forma que  se encuentre
dentro del tramo I1 - I2 . Nos haremos ahora dos preguntas: a) ¿cómo calcular los
valores de los extremos de dicho intervalo de manera que contenga el desconocido
valor de ? b) con que confianza, es decir, cual será la probabilidad de que
efectivamente el desconocido valor de  se encuentre dentro de dicho intervalo?
El valor verdadero del lote, esto es , tendrá una cierta probabilidad conocida de
estar situada en el interior de dicho intervalo. Anteriormente hemos visto que el
intervalo: menos una desviación típica y más una desviación típica, alrededor de
la media aritmética, encierra un área de 68.27%, si usamos este concepto en
términos de probabilidades podemos decir que si tomamos una unidad de la
distribución, tenemos una probabilidad del 68.27% de que se encuentre en el
intervalo de mas-menos una desviación típica de la media aritmética.

Con el mismo criterio podemos decir que la probabilidad de que se encuentre en el


intervalo de mas-menos dos desviaciones típicas es del 95.45% y de mas-menos tres
desviaciones típicas del 99.73%

Por otra parte, la variable , es la desviación respecto a la media calculada


con una unidad igual a la desviación normal. Es decir la tabla normal de Gauss es
una distribución donde la desviación típica vale 1 y la media aritmética vale cero.

En consecuencia, la probabilidad de encontrar un valor determinado de z, inferior a


1 y superior a –1, es del 68.27% inferior a 2 y superior a –2, del 95.45% e inferior a 3
y superior a -3, del 99.73%.

En consecuencia, la probabilidad de un valor de z fuera del intervalo 1 a -1, es de


31.73%, fuera del intervalo 2 a -2, del 4.55% y fuera del intervalo 3 a -3, del 0.27%.

Utilizando la Tabla Normal de Gauss, podemos construir la siguiente tabla que nos
será de utilidad para el resto de este capítulo y el siguiente:

% nivel de 99.73 99.0 98.0 96.0 95.45 95.0 90.0 80.0 68.27 50.0 38.30
confianza
z 3 2.58 2.33 2.05 2 1.96 1.645 1.28 1 0.6745 0.500

Derechos de autor en trámite Página 111 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

11.3 Estimación de la media aritmética.

Supongamos que queremos determinar la resistencia a la tracción de un lote de


barras de acero al carbono contenidas en una industria.

De ensayos anteriores, conocemos que la desviación típica poblacional vale 200


Kg./cm2

Extraemos al azar, una muestra de 100 barras y medimos .


¿Qué podemos inferir respecto de la media real ?

Para esto sabemos que:

1) Las medias de las muestras de 100 u, tomadas al azar, tienen como


media general: , (Teorema del Límite Central, Capítulo 10).

2) La desviación normal de las medias, que mide su dispersión alrededor de 


es:

Puesto que n es 100, o sea es mayor de 30, de acuerdo con lo visto en la Teoría del
Muestreo, Capítulo 10, la distribución de las medias de muestreo, será normal.

Supongamos ahora que queremos saber cual es la probabilidad de que el valor


encontrado , no difiera en más de 50 Kg../cm 2de la media de la población : 

Este planteo supone dos hipótesis:

a) 5500 -   50 5500-50  

b)  - 5500  50   5500+50

Y estas expresiones pueden resumirse como:

5500 - 50    5500 + 50

5450    5550

Derechos de autor en trámite Página 112 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Estos serán los valores extremos que nos interesan, transformemos estos valores en
unidades de la variable z (es ambos lados iguales)

z=

La probabilidad para 2.,5 , según la tabla de Gauss es de 49.38% y por estar a


ambos lados de la media será el doble, esto es 98,76%.
Así pues, podemos decir que existe un 98,76% de probabilidad, de que el
desconocido valor de  , se encuentre entre 5450 Kg./cm 2 y 5550 Kg./cm2.
Y, como consecuencia, la probabilidad de que se encuentre fuera de dicho
intervalo, será 100,00 % – 98.76 % = 1,24 %.

11.4 Margen de error y coeficiente de confianza.

Puesto que con una muestra, estamos infiriendo cual podría ser el valor del
parámetro poblacional, es una consecuencia lógica pensar que la diferencia entre la
conocida y la  desconocida sea considerada como el Error de la Estimación.
Este error será menor, cuando mayor sea la muestra. Lo cual está en línea con todo
lo que se ha venido enseñando, cuanto mayor es la muestra, mejor y más confiable
es la respuesta de la muestra.
Si lo que queremos hacer es una estimación del error que tiene una probabilidad de
ser menor al 5%, significará que el intervalo, que comprende el interior de la curva
gaussiana, será el 95% del área de la curva normal.

Derechos de autor en trámite Página 113 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

5450

5500

5550
Por otra parte, si queremos que afuera del intervalo, exista 5%, como es simétrico,
será, 2,5 % a cada lado del intervalo.

Por lo tanto, si en el interior de la figura, entre ambos límites, tenemos el 95% del
área, de la mitad hacia cualquiera de los dos lados tendremos el 47.5% del área, y si
buscamos en la tablas de Gauss, para el dato más cercanos a dicho a dicho valor,
tenemos que z = 1,96

De acuerdo con lo desarrollado, podemos concluir, que el error de la estimación, de


un 95% va desde z = -1.96 a z = +1.96.

De esta forma llegamos al concepto de Límites de Confianza y es el intervalo dentro


del cual estimamos que puede encontrarse el valor de la Media Poblacional llamada
.

La fórmula generalizada, la podemos describir como sigue:

en el caso que hemos desarrollado, estos límites con 95% de confianza serán:

También podemos expresarlo de esta otra manera:

5461<<5539

Y se expresa que, con un Coeficiente de Confianza del 95% , el desconocido valor


de la media poblacional: , se encuentra entre los Límites de Confianza: 5461 y
5539.

Derechos de autor en trámite Página 114 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

En el cálculo anterior hemos desarrollado los límites de confianza para un margen de


error del 5%, pero de la misma manera podemos rehacer el cálculo para otros
Coeficientes de Confianza, veamos dos ejemplos, para 90% y 99%.

Para el primero, 90% implica un margen de error del 10%, esto es 5% de cada lado.
Para 90% significa 45% a cada lado del cero en la distribución normal de Gauss, por
ello buscamos el z mas cercano a .4500 y encontramos que el valor de z es 1.64.

o bien:

5467<<5533

Esto último significa que, con un margen de error del 10%, o dicho de otra manera,
con una confianza del 90% podemos decir, que el desconocido valor de la media
poblacional se encuentra entre 5467 y 5533.

Rehacemos el cálculo para un 99% de confianza o 1% de error:

o bien:

5449<<5551

Como se puede apreciar, a medida que aumentamos la confianza, los Limites se


abren más, cuando somos menos exigentes, los límites se juntan.

Nivel de Confianza Límites de Confianza

90% 5467<<5533
95% 5461<<5539
99% 5449<<5551

11.5 No siempre se conoce el valor de la desviación típica poblacional.

En el ejemplo anterior se partió de la suposición de que conocíamos el valor de la


desviación típica de la población. En ese caso los cálculos son como se han
mostrado. Pero las fórmulas cambian un poco cuando no se conoce dicho parámetro.

Cuando no se conoce se debe hacer una estimación con una muestra tomada al azar
del lote en estudio, esta muestra deberá ser preferentemente mayor a 30 unidades y
los cálculos deberán contener una corrección dada por la siguiente fórmula:

Derechos de autor en trámite Página 115 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

El valor de  es el que se obtiene de la muestra mayor a 30, y el valor que figura bajo
el signo radical, es el factor que permite estimar, en función del valor hallado, cual
sería el valor del parámetro de la población.

Una vez estimado se hacen los cálculos como se describió anteriormente.

Otra situación que se puede dar es la siguiente, la muestra es menor a 30, pero
conocemos la desviación típica de la población, en ese caso, también procedemos
igual que lo descrito, pues lo que importa es el valor de la población conocido.
Pero, cuando no conocemos la desviación típica poblacional, y la tenemos que
estimar con una muestra de 30 o menos, entonces ya no sirve la distribución
Gaussiana y la estimación vista anteriormente no es válida.
En este caso, se utiliza la llamada Distribución t, que veremos a continuación.

11.6 Distribución t, o Distribución de Student.

Esta distribución se utiliza para muestras pequeñas, el valor de z se reemplaza por el


valor t que es como una z más amplia, debido a la menor confianza que nos brinda la
muestra al ser 30 ó menos.
Esta variable t se encuentra dada en la siguiente tabla y en ella puede observarse
que la columna de la izquierda se titula Grados de Libertad. Esto es uno menos que
el tamaño de la muestra.
Los Grados de Libertad son los valores que se pueden fijar libremente.
La fórmula general para muestras de 30 ó menos y cuando no se conoce el valor de
la desviación típica poblacional es:

donde el valor de  se obtiene a partir de la muestra.

Derechos de autor en trámite Página 116 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

DISTRIBUCIÓN t de Student

El Coeficiente de Confianza está representado por el área interior de la


distribución.
El error está representado por las "colas" a ambos lados de la
distribución.

Confianz
a  0,50 0,75 0,80 0,85 0,90 0,95 0,98 0,99
Error  0,50 0,25 0,20 0,15 0,10 0,05 0,02 0,01

Grados 1 1,000 2,414 3,078 4,165 6,314 12,706 31,821 63,656


De 2 0,816 1,604 1,886 2,282 2,920 4,303 6,965 9,925
Libertad 3 0,765 1,423 1,638 1,924 2,353 3,182 4,541 5,841
 4 0,741 1,344 1,533 1,778 2,132 2,776 3,747 4,604
5 0,727 1,301 1,476 1,699 2,015 2,571 3,365 4,032
6 0,718 1,273 1,440 1,650 1,943 2,447 3,143 3,707
7 0,711 1,254 1,415 1,617 1,895 2,365 2,998 3,499
8 0,706 1,240 1,397 1,592 1,860 2,306 2,896 3,355
9 0,703 1,230 1,383 1,574 1,833 2,262 2,821 3,250
10 0,700 1,221 1,372 1,559 1,812 2,228 2,764 3,169
11 0,697 1,214 1,363 1,548 1,796 2,201 2,718 3,106
12 0,695 1,209 1,356 1,538 1,782 2,179 2,681 3,055
13 0,694 1,204 1,350 1,530 1,771 2,160 2,650 3,012
14 0,692 1,200 1,345 1,523 1,761 2,145 2,624 2,977
15 0,691 1,197 1,341 1,517 1,753 2,131 2,602 2,947
16 0,690 1,194 1,337 1,512 1,746 2,120 2,583 2,921
17 0,689 1,191 1,333 1,508 1,740 2,110 2,567 2,898
18 0,688 1,189 1,330 1,504 1,734 2,101 2,552 2,878
19 0,688 1,187 1,328 1,500 1,729 2,093 2,539 2,861
20 0,687 1,185 1,325 1,497 1,725 2,086 2,528 2,845
21 0,686 1,183 1,323 1,494 1,721 2,080 2,518 2,831
22 0,686 1,182 1,321 1,492 1,717 2,074 2,508 2,819
23 0,685 1,180 1,319 1,489 1,714 2,069 2,500 2,807
24 0,685 1,179 1,318 1,487 1,711 2,064 2,492 2,797
25 0,684 1,178 1,316 1,485 1,708 2,060 2,485 2,787
26 0,684 1,177 1,315 1,483 1,706 2,056 2,479 2,779
27 0,684 1,176 1,314 1,482 1,703 2,052 2,473 2,771
28 0,683 1,175 1,313 1,480 1,701 2,048 2,467 2,763
29 0,683 1,174 1,311 1,479 1,699 2,045 2,462 2,756
30 0,683 1,173 1,310 1,477 1,697 2,042 2,457 2,750
40 0,681 1,167 1,303 1,468 1,684 2,021 2,423 2,704
60 0,679 1,162 1,296 1,458 1,671 2,000 2,390 2,660
120 0,677 1,156 1,289 1,449 1,658 1,980 2,358 2,617

Derechos de autor en trámite Página 117 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Ejemplo 1:

Para obtener el valor de t que corresponde a un área de 0,10 en ambos extremos de


la distribución combinada, cuando hay 19 grados de libertad, se busca bajo la
columna correspondiente a 0,10 y se baja por ella hasta el renglón de los 19 grados
de libertad; el valor correspondiente de t es 1.729

Derechos de autor en trámite Página 118 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Ejemplo 2:

Continuando con el ejemplo visto en 11.3, donde queremos determinar la resistencia


a la tracción de un lote de barras de acero al carbono contenidas en una industria.

Extraemos al azar, una muestra de 26 barras y medimos y  =


200 kg/ cm2 ¿Qué podemos inferir respecto de la media real ?

Deseamos pronunciarnos con una confianza del 95%, es decir, con un margen de
error del 5%.

Aplicando la fórmula vista para la distribución t tenemos:

o bien:

5418<<5582

Como puede apreciarse, los límites se han abierto significativamente debido a la falta
de confianza en una muestra chica.

11.7 Intervalos de confianza para las proporciones o porcentajes de


defectuosos.

En 8.1, definimos que, para la distribución Binomial es:

Derechos de autor en trámite Página 119 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Pero ahora nos interesa solo p, es decir el % defectuoso, para ello dividimos las
fórmulas por el valor de n y nos queda:

Así, la fórmula para los intervalos de confianza para las proporciones o porcentajes
de defectuosos, estará dada por la siguiente expresión:

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico.

Capítulo 9

Ejercicios: 9.5, 9.6, 9.7, 9.9, 9.10, 9.11, 9.12, 9.22, 9.23, 9.24, 9.25, 9.26,
9.27, 9.28, 9.30, 9.31, 9.32, 9.33, 9.34.

Derechos de autor en trámite Página 120 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 12
12 Números Índice
12.1 Relaciones de Precios

La Relación de Precios es el cociente entre el precio de un artículo en un período


dado y su precio en otro período, conocido como período base o período de
referencia

Problema

Los precios al por menor, en centavos por libra, del cinc en Usa, durante 1978-84
son:

Año 1978 1979 1980 1981 1982 1983 1984


Precio promedio del 31.0 37.3 37.4 44.6 38.5 41.4 48.6
cinc

a) Con 1978 como base, hallar las relaciones de precios correspondientes a los
años 1982 y 1984

b) Con 1980 como base, hallar las relaciones de precios correspondientes a los años
dados:

Año 1978 1979 1980 1981 1982 1983 1984


Relación de precios 82.9 99.7 100 119.3 102.9 1107 129.9
1980 = 100

c) Usando como base 1978 – 1980, hallar las relaciones de precios


correspondientes a los años dados. Primero hallamos el promedio de precios del
periodo base: 35.2 Segundo dividimos cada precio de la primera tabla:

Año 1978 1979 1980 1981 1982 1983 1984


Relación de precios 88.1 106.0 106.3 126.7 109.4 117.6 138.1
1978-1980 = 100

Derechos de autor en trámite Página 121 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

12.2 Relaciones de Cantidad o de Volumen

Si qo denota la cantidad o volumen de producción, consumo, exportación, etc.,


durante un período base, y q n la correspondiente cantidad producida, consumida,
etc., durante un período dado, definimos:

Problema

La tabla presenta la producción de trigo en Usa de 1977 a 1985. Reducir los datos de
la tabla a relaciones de cantidad usando a) 1982 b) 1977-1980 como base:

Año 1977 1978 1979 1980 1981 1982 1983 1984 1985
Producción de trigo 2046 1776 2134 2380 2785 2765 2420 2595 2425

Reducir los datos de la tabla a relaciones de cantidad usando a) 1982 y b) 1977-1980


como base:

a) Se dividen las cifras por 2765:

Año 1977 1978 1979 1980 1981 1982 1983 1984 1985
Relación 74.0 64.2 77.2 86.1 100.7 100.0 87.5 93.9 87.7
Cantidad
(1982=100)

b) La media aritmética de los años 1977 – 1980 es 2084, luego se divide la


producción de cada año. ( Comprobación : la suma de los valores del período
dividido 4 = 100)

Año 1977 1978 1979 1980 1981 1982 1983 1984 1985
Relación 98.2 85.2 102.4 114.2 133.6 132.7 116.1 124.5 116.4
Cantidad

(1977-1980=100)

Derechos de autor en trámite Página 122 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

12.3 Relaciones de Valor

Si p es el precio de un artículo durante un período y q es la cantidad (o volumen)


Producida, vendida, etc., durante ese período, entonces pq se llama valor total
Si po y qo son el precio y la cantidad de un artículo durante un período base y p n y qn
el precio y la cantidad correspondiente a un período dado, entonces definimos:

Problema
En enero de 1980 una empresa pagó un total de $80.000 a 120 empleados en
nómina.
En Julio de ese mismo año, la empresa tenía 30 trabajadores más en nómina y pagó
$12.000 más que en enero.

a) Con enero de 1980 como base, hallar el número índice de empleo (la relación de
cantidad) para julio.

b) Con enero de 1980 como base, hallar el número índice (relación de valor)
trabajo - gasto para julio.

c) Usando el resultado: relación de precios x relación de cantidad = relación de valor,


¿qué interpretación se le puede dar a la relación de precios en éste caso?

Solución:
a) El número índice de empleo es:

b) El número índice trabajo – gasto es:

c) Despejando de la relación indicada;

Este es un número índice de costo por empleado. Significa que en julio de 1980 el
costo por empleado era el 92% del de enero de 1980.

Derechos de autor en trámite Página 123 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

12.4 Relaciones de Enlace y en Cadena

Si p1, p2, p3,... representan los precios durante intervalos sucesivos de tiempo 1, 2, 3 ...,
Entonces p1/2, p2/3, p3/4, ... representan las relaciones de precios de cada intervalo
respecto al intervalo de tiempo precedente y se llaman: Relaciones de enlace
Cuando se interpretan una a continuación de otra y se lee la variación entre un
tiempo y otro forman una Cadena que muestra la variación del precio entre dichos
dos instantes de tiempo.
Problema
Supongamos que tenemos que actualizar el monto del arriendo de un departamento
que en el mes de Diciembre fue de $100.000,
a) Se desea saber cual será, actualizado el monto en el mes de Julio del siguiente
año.
b) Cual será la variación del precio entre Abril y Junio.
La información disponible son los índices de variación de precios al consumidor (IPC)
de cada mes:

Enero 1.1% Abril 0.5%


Febrero 0.9% Mayo 0.9%
Marzo 1.5% Junio 1.2%

Solución:
a) En primer término se debe escribir la relación de enlace, en forma de índice, para
cada dato mensual:

Enero 1.011 Abril 1.005


Febrero 1.009 Mayo 1.009
Marzo 1.015 Junio 1.012

Luego se calcula el producto de todos ellos:


1.011*1.009*1.015*1.005*1.009*1.012 = 1.0625
Este cálculo indica que la variación de precios a sido del 6.25% en los 6 meses
estudiados. Este cálculo es una cadena de 6 meses.
El producto de 1.0625 por el valor del arriendo en Diciembre nos indica el valor que
deberá cobrarse en Julio. El resultado es: $ 106.250
c) La variación de precios entre Abril y Junio será:
1.005*1.009*1.012 = 1.0262
Esto es el 2.62 %

Derechos de autor en trámite Página 124 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

12.5 El método de agregación simple

Es el cociente del precio total de los artículos en el año dado, p n y el precio total de
los artículos en el año base, po. Se expresa en forma porcentual.

Desventajas del método


1) No tiene en cuenta la importancia relativa de cada artículo.
2) El tipo de unidades escogidas al anotar los precios afectan al índice.
(kg. o gr. , litros o mililitros, etc.)

Problema
La tabla muestra los precios al por mayor y las producciones en Usa de leche,
mantequilla y queso para 1980, 1981, y 1985. Calcular un índice de precios al por
mayor por agregación de estos productos para el año 1985, tomando como base :
a) 1980 y b) 1980 – 1981.

Precios (centavos por libra) 1980 1981 1985


Leche 13.2 14.0 12.9
Mantequilla 139.3 148.0 141.1
Queso 156.2 167.2 162.0

a) El índice de precios por agregación simple es:

b) El precio promedio 1980-1981:


De la leche: 13.5, de la mantequilla: 143.7 y del queso: 161.7

Por lo tanto el índice de precios por agregación simple es:

En la práctica la cantidad de artículos que integran un índice es muy grande y


conforman una “canasta” .

Derechos de autor en trámite Página 125 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

12.6 El método del promedio simple de relaciones

Método de la media aritmética.

Este método mejora respecto al anterior en que ya no tiene la segunda desventaja,


pero, conserva la primera.

Problema

Calcular un índice de precios al por mayor para el año 1985, usando 1980 como
base.

Precios (centavos por libra) 1980 1981 1985


Leche 13.23 13.95 12.90
Mantequilla 139.3 148.0 141.1
Queso 156.2 167.2 162.0

Relación de precios.

De la leche: 12.90/13.23= 97.5%


De la mantequilla: 141.1/139.3=101.3%
Del queso: 162.0/156.2=103.7%

Derechos de autor en trámite Página 126 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

12.7 El método de agregación ponderada

Con el fin de evitar las desventajas del método de agregación simple, asignamos un
peso al precio de cada artículo, en general la cantidad vendida durante el año base,
durante el año dado o durante algún año típico. Tales pesos indican la importancia
del artículo en cuestión. Se usan las siguientes fórmulas de pendiendo de p o y pn,

1. Indice de Laspeyres o método del año base:

El término poqo recibe el nombre de “canasta”

2. Indice de Paasche o método del año dado:

Derechos de autor en trámite Página 127 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

12.7.1 El método de agregación ponderada por el Indice de Laspeyres o método


del año base:

Problema
Precios (centavos por libra) Cantidad ( millones de libras)
Años 1980 1981 1985 1980 1981 1985
Leche 13,23 13,95 12,90 128500 132800 143700
Mantequilla 139,3 148,0 141,1 1145 1228 1248
Queso 156,2 167,2 162,0 2381 2664 2854

Con los datos de la tabla calcular el índice de Laspeyres para 1985 con a) 1980 b)
con 1980-1981 de base:

a)

b)

Este ejercicio de debe realizar en clase formando grupos de alumnos.

Derechos de autor en trámite Página 128 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

12.7.2 El método de agregación ponderada por el Indice de Paasche o método


del año dado:

Problema
Precios (centavos por libra) Cantidad ( millones de
libras)
Años 1980 1981 1985 1980 1981 1985
Leche 13,23 13,95 12,90 128500 132800 143700
Mantequilla 139,3 148,0 141,1 1145 1228 1248
Queso 156,2 167,2 162,0 2381 2664 2854

Con los datos de la tabla calcular el índice de Paasche para 1985 con a) 1980 b)
con 1980-1981 de base:

a) Base: 1980

b) Base: 1980 - 1981

Derechos de autor en trámite Página 129 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

12.8 Deflación de series en el tiempo

Aunque los ingresos de las personas pueden estar creciendo teóricamente durante
un cierto número de años, sus ingresos reales pueden estar disminuyendo debido al
costo de la vida, y por lo tanto puede estar disminuyendo su poder adquisitivo. Es
decir que con la misma plata se compra menos productos. Calculamos los ingresos
reales dividiendo los ingresos aparentes de cada año por el número índice del costo
de la vida en ese año, usando un período bases adecuado.
Ejemplo: Una persona gana en 1980 150% de lo que ganaba en 1970 significa un
crecimiento del 50%. Sien el mismo período el costo de vida creció al 200% entonces
su ingreso real son solo 150/2 = 75% de lo que era en 1970.
Problema
La tabla muestra el salario semanal medio de los trabajadores en el comercio
minorista de Usa durante 1973-1983. También contiene el índice de precios al
consumo para esos años, con 1972 como base. En términos del salario medio de
1973, determinar sus salarios reales en los años 1973-1983.

Año
1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983

Salario 96.32 102.68 108.86 114.60 121.66 130.20 138.62 147.38 158.03 163.85 171.05

Indice
de 106.2 117.9 128.7 136.1 144.9 155.9 173.5 197.0 217.4 230.7 238.1
precio

Solución:
Hallamos primero un número índice de precios al consumo con 1973 como base, dividiendo

todos los números de la fila de abajo en la tabla por 106.2, en %, Luego se divide cada salario

promedio por el correspondiente número índice para obtener los salarios reales.

Año 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983

Indice
(1973 100.0 111.0 121.2 128.2 136.4 146.8 163.4 185.5 204.7 217.2 224.2
=100)

Salario
96.32 92.50 89.82 89.39 89.19 88.69 84.83 79.45 77.20 75.44 76.29
real

El salario real a 1983 es 171.05/224.2%=76.29. Los salarios se han casi doblado, los
salarios reales han decrecido, el salario real en 1983 era 20 pesos menor que el de
1973. En síntesis, el poder adquisitivo disminuyó en 20/96.32=21%

12.9 Ejercicios de Aplicación.

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico

Derechos de autor en trámite Página 130 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 19: 19.1, 19.4, 19.5, 19.7, 19.8, 19.13, 19.20, 19.39, 19.41, 19.45, 19.48,
19.49, 19.50, 19.51, 19.52, 19.53, 19.55, 19.57, 19.61, 19.62, 19.77

Derechos de autor en trámite Página 131 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 13
13 Series en el tiempo.

13.1 Análisis de series en el tiempo

Una serie en el tiempo son observaciones tomadas en momentos determinados


preferentemente a intervalos regulares. Normalmente estas observaciones se
grafican dando así los llamados Gráficos de series de Tiempo.
Para explicar en que consiste el análisis que nos interesa, recurriremos a un ejemplo
tomado del libro de Estadística de M. Spieguel. Se trata de la Producción de energía
eléctrica no industrial en E.E.U.U. en el período 1976-1981.
En este gráfico podremos describir dos tipos de observaciones, dependiendo de que
es lo que queremos averiguar.
La primera observación del comportamiento alterno, si se quiere violento en sus
variaciones, es que el conjunto muestra una tendencia a crecer, a incrementarse con
el tiempo.
La segunda observación será que las ondulaciones del gráfico sugieren variaciones
estacionales donde se repiten situaciones sucesivas de crecimientos muy rápidos
seguidos de depresiones de casi iguales características.
El análisis de la serie va a depender, precisamente, del tipo de información que
necesitamos.
Si lo que buscamos es el comportamiento al largo plazo, nos va a proporcionar la
información requerida una regresión lineal o un análisis de la tendencia. Cualquiera
de estos dos procedimientos, nos proporciona una recta que pasa por los lugares
mas cercanos a todos los puntos representando así a todo el conjunto. Estas rectas
se utilizan especialmente para predecir. Este concepto correlación y regresión, ya
fue visto en el Capítulo 9 de este Apunte.
Pero, si lo que nos interesa son las fluctuaciones en el corto y mediano plazo, nos
interesará conocer las causas de las fluctuaciones, predecirlas pero en el corto plazo,
ver la regularidad, si existe, de dichos ciclos. para eso lo que nos conviene es
suavizar las movimientos enérgicos de los datos individuales, y para ello
recurriremos a los llamados Promedios Móviles.
La función de estos Promedios Móviles es disminuir la variación de los datos

individuales y los transforma de ondas más suaves donde podemos analizar la

periodicidad, si existe, asimilarla a períodos temporales como invierno, verano, noche

y día, o cualquier otra causa que pudiera deducirse como responsables de las

variaciones que se estudian.

Existen promedios móviles para tres períodos, cinco períodos, siete, etc. Es
preferible por razones que veremos adelante utilizar promedios móviles impares
para poder representar los gráficos correctamente.
Si por necesidad se utiliza un promedio móvil par, se lo denomina no centrado.
Los promedios móviles no centrados pueden centrarse, repitiendo los
promedios de nuevo, pero utilizando la misma serie obtenida.

Derechos de autor en trámite Página 132 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

A continuación se analiza cada caso.


En las dos primeras páginas figuran en columnas: a) los períodos estudiados, b) los
valores correspondientes a cada período considerado (consumos mensuales), c) los
valores que describen la Tendencia, d) los valores que describen la Recta de
Regresión, e) los Promedios Móviles de tres meses, f) los Promedios Móviles de 5
meses.

Los gráficos muestran sucesivamente:


Gráfico 1: La variación de los consumos mensuales
Gráfico 2: Las rectas de Tendencia y de Regresión Lineal correspondientes a
los consumos anteriores.
Gráfico 3: El Promedio Móvil de 3 meses
Gráfico 4: El Promedio Móvil de 5 meses.
Gráfico 5 : Todos los gráficos juntos.
La interpretación sería la siguiente:
El consumo muestra un crecimiento sostenido a lo largo del período estudiado. El
incremento del período puede estimarse en 13% considerando los promedios del
primero y el último año.
El promedio móvil de 3 meses es insuficiente para descubrir las variaciones
estacionales, pero el de 5 meses muestra claramente 6 variaciones estacionales
correspondientes a los años estudiados, estas variaciones estacionales anuales
corresponden al incremento de consumo en los meses de invierno y su decrecimiento
en la temporada de verano.
Por otra parte, debemos considerar lo siguiente, los promedios móviles estudiados de
3 y 5 meses se los llama centrados pues el valor hallado puede asignarse al mes del
medio de la serie. Si por alguna razón se toma un número par de meses, el valor
obtenido se lo denomina no centrado pues el valor hallado se encuentra entre los
dos valores centrales, y esto debe tenerse en cuenta en caso de necesitar
graficarlos. Una buena solución es volver a promediar de a pares los valores
obtenidos con lo que se vuelven a centrar. Este caso se discute en clase.
Hemos mencionado hasta ahora dos tipos de movimientos de las series estacionales,
al primero lo hemos denominado tendencia y recibe también el nombre de
movimiento secular o de largo plazo. Al segundo lo llamamos variaciones
estacionales que se suceden dentro del año, pero estos no son los únicos
movimientos de una serie, existen los llamados ciclos con las mismas características
que los estacionales, pero que no se ajustan a un período anual sino que pueden ser
menores o mayores a un año, son muy conocidos los llamados ciclos económicos
que representan prosperidad, recesión, depresión y recuperación. Otro caso pueden
ser los llamados Movimientos irregulares o aleatorios, estos movimientos se
producen a consecuencia de hechos muy significativos, como puede ser guerra,
terremotos y otros que producen un cambio del escenario que hasta ahora
funcionaba y este cambio producirá una interferencia muy importante hasta que se
establezca un nuevo panorama, que permita nuevamente la predicción estadística.

TIEMPO VALORES TENDENCIA REGRESION PROMEDIO PROMEDIO


MENSUALES MOVIL DE MOVIL DE
TRES MESES CINCO
MESES

Derechos de autor en trámite Página 133 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

1976 ERO 178,2 170,5 169,9


FRO 156,7 170,8 170,3 166,4
MZO 164,2 171,2 170,6 158,0 162,0
ABR 153,2 171,5 171,0 158,3 160,8
MYO 157,5 171,9 171,4 161,1 166,7
JUN 172,6 172,3 171,7 172,0 171,0
JUL 185,9 172,6 172,1 181,4 173,4
AGO 185,8 173,0 172,4 178,9 174,6
SET 165,0 173,4 172,8 171,5 173,9
OCT 163,6 173,7 173,2 165,9 173,3
NOV 169,0 174,1 173,5 171,9 175,4
1977 DIC 183,1 174,4 173,9 182,8 175,0
ERO 196,3 174,8 174,2 180,7 176,0
FRO 162,8 175,2 174,6 175,9 173,5
MZO 168,6 175,5 175,0 162,8 170,6
ABR 156,9 175,9 175,3 164,6 167,3
MYO 168,2 176,2 175,7 168,4 174,4
JUN 180,2 176,6 176,1 182,1 179,8
JUL 197,9 177,0 176,4 191,3 183,6
AGO 195,9 177,3 176,8 189,9 183,3
SET 176,0 177,7 177,1 179,4 180,5
OCT 166,4 178,0 177,5 169,6 177,7
NOV 166,3 178,4 177,9 172,2 178,0
1978 DIC 183,9 178,8 178,2 182,5 177,5
ERO 197,3 179,1 178,6 185,0 178,9
FRO 173,7 179,5 178,9 181,4 177,6
MZO 173,2 179,8 179,3 168,9 175,8
ABR 159,7 180,2 179,7 169,4 173,8
MYO 175,2 180,6 180,0 174,1 179,6
JUN 187,4 180,9 180,4 188,4 186,1
JUL 202,6 181,3 180,8 198,5 191,3
AGO 205,6 181,7 181,1 197,9 191,4
SET 185,6 182,0 181,5 188,9 189,1
OCT 175,6 182,4 181,8 179,2 187,0
NOV 176,3 182,7 182,2 181,2 187,7
1979 DIC 191,7 183,1 182,6 192,5 187,9
ERO 209,5 183,5 182,9 195,8 189,4
FRO 186,3 183,8 183,3 192,9 188,0
MZO 183,0 184,2 183,6 179,6 185,3
ABR 169,5 184,5 184,0 176,9 180,7
MYO 178,2 184,9 184,4 178,1 184,0
JUN 186,7 185,3 184,7 189,1 188,3
JUL 202,4 185,6 185,1 198,0 190,6
AGO 204,9 186,0 185,5 196,0 190,9
SET 180,6 186,3 185,8 188,4 189,0
OCT 179,8 186,7 186,2 179,3 186,3
NOV 177,4 187,1 186,5 182,0 185,3
1980 DIC 188,9 187,4 186,9 188,8 187,0
ERO 200,0 187,8 187,3 192,5 188,5
FRO 188,7 188,1 187,6 192,1 186,7
MZO 187,5 188,5 188,0 181,6 184,1

Derechos de autor en trámite Página 134 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

ABR 168,6 188,9 188,4 177,3 182,0


MYO 175,7 189,2 188,7 177,9 187,5
JUN 189,4 189,6 189,1 193,7 193,0
JUL 216,1 189,9 189,4 207,0 197,6
AGO 215,4 190,3 189,8 207,6 198,2
SET 191,4 190,7 190,2 195,1 196,0
OCT 178,5 191,0 190,5 182,8 191,9
NOV 178,6 191,4 190,9 184,2 189,9
1981 DIC 195,6 191,8 191,2 193,1 187,5
ERO 205,2 192,1 191,6 193,5 188,9
FRO 179,6 192,5 192,0 190,1 187,6
MZO 185,4 192,8 192,3 179,1 184,1
ABR 172,4 193,2 192,7 178,5 183,6
MYO 177,7 193,6 193,1 184,3 191,7
JUN 202,7 193,9 193,4 200,2 196,6
JUL 220,2 194,3 193,8 211,0 199,5
AGO 210,2 194,6 194,1 205,8 200,3
SET 186,9 195,0 194,5 192,8 194,9
OCT 181,4 195,4 194,9 181,3 189,9
NOV 175,6 195,7 195,2 184,2
DIC 195,6 196,1 195,6

Derechos de autor en trámite Página 135 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Derechos de autor en trámite Página 136 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Derechos de autor en trámite Página 137 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Derechos de autor en trámite Página 138 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Derechos de autor en trámite Página 139 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

13.2 Estimación de las variaciones Estacionales. El Indice Estacional.

Utilizando los mismos datos anteriores, procederemos a calcular los índices


estacionales para el período dado.

La siguiente tabla repite los datos pero ordenados para poder realizar los cálculos en
forma ordenada.

Ero Fro Mzo Abr Myo Jun Jul Ago Set Oct Nov Dic
1976 178.2 156.7 164.2 153.2 157.5 172.6 185.9 185.8 165.0 163.6 169.0 183.1
1977 196.6 162.8 168.6 156.9 168.2 180.2 197.9 195.9 176.0 166.4 166.3 183.9
1978 197.3 173.7 173.2 159.7 175.2 187.4 202.6 205.6 185.6 175.6 176.3 191.7
1979 209.5 186.3 183.0 169.5 178.2 186.7 202.4 204.9 180.6 179.8 177.4 188.9
1980 200.0 188.7 187.5 168.6 175.7 189.4 216.1 215.4 191.5 178.5 178.6 195.6
1981 205.2 179.6 185.4 172.4 177.7 202.7 220.2 210.2 186.9 181.4 175.6 195.6

A continuación procederemos a calcular los promedios mensuales para cada año:

AÑO PROMEDIO ANUAL


1976 169.6
1977 176.6
1978 183.7
1979 187.3
1980 190.5
1981 191.1

Utilizando cada promedio mensual, transformaremos cada valor mensual de la

primera tabla en un índice, de la forma siguiente: 178.2/169.6 = 105.1%

ERO FRO MZA ABR MYO JUN JUL AGO SET OCT NOV DIC
1976 105.1 92.4 96.8 90.3 92.9 101.8 109.6 109.6 97.3 96.5 99.6 108.0
1977 111.2 92.2 95.5 88.8 95.2 102.0 112.1 110.9 99.7 94.2 94.2 104.1
1978 107.4 94.6 94.3 86.9 95.4 102.0 110.3 111.9 101.0 95.6 96.0 104.4
1979 111.9 99.5 97.7 90.5 95.1 99.7 108.1 109.4 96.4 96.0 94.7 100.9
1980 105.0 99.1 98.4 88.5 92.2 99.4 113.4 113.1 100.5 93.7 93.8 102.7
1981 107.4 94.0 97.0 90.2 93.0 106.1 115.2 110.0 97.8 94.9 91.9 102.4
Total 648.0 571.8 579.7 535.2 563.8 611.0 668.7 664.9 592.7 570.9 570.2 622.5

108.0 95.3 96.6 89.2 94.0 101.8 111.5 110.8 98.8 95.2 95.0 103.8
Media

Derechos de autor en trámite Página 140 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Esta última fila son los datos buscados y representan los índices Estacionales

Derechos de autor en trámite Página 141 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

13.3 Ejercicios de Aplicación.

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico

Capítulo 13: 18.1, 18.3, 18.6, 18.7, 18.9, 18.17, 18.18, 18.19, 18.21, 18.32, 18.36,
18.42

Derechos de autor en trámite Página 142 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capitulo 14
14 Pruebas de Hipótesis

Los casos prácticos de la toma de decisiones, se ven muchas veces ayudados por
pruebas estadísticas que nos ayudan a decidir si algo es diferente que otro, si ambos
pertenecen a una misma familia o si son estadísticamente diferentes. Estos
procedimientos estadísticos tienen la virtud de que se puede conocer el riesgo que se
tiene al tomar las diferentes decisiones.

14.1 Hipótesis Estadísticas

El siguiente procedimiento es un método formal (y antiguo) de mencionar las


diferentes alternativas de decisiones.

Hipótesis nula = H0
Esta hipótesis se plantea con el propósito de probar si lo que se dice es verdad y se
plantea lo inverso como alternativa. Se dice que no es verdad lo que se quiere
demostrar. Por ejemplo, si sospechamos que una moneda es falsa y queremos
demostrarlo, partimos de la Hipótesis Nula de que la moneda es buena.
Esta Hipótesis la designaremos como H0.

Hipótesis Alternativa = H1
Todo lo que difiera de la Hipótesis Nula, se denomina Hipótesis Alternativa.
Por ejemplo, si una Hipótesis Nula, fuera p = 0,5, Hipótesis Alternativa, podría ser:

P = 0,7 ó p  0,5 ó p > 0,5 etc.

La Hipótesis Alternativa se denota como H1.

14.2 Contrastes de Hipótesis y significación, o reglas de decisión.

En ciertas circunstancias, la información que rodea un experimento sustenta la idea


de que algo es de determinada manera, pero los resultados de los ensayos no
parecen apoyar nuestra presunción. En esas circunstancias, diremos que los
resultados resultan significativamente diferentes y nos veremos inclinados a rechazar
la hipótesis o al menos a no aceptarla.
Por ejemplo, supongamos que tenemos un dado que creemos bueno, pero al
arrojarlo 60 veces el 1 aparece 18 veces, esto esta muy alejado de las probables 10
veces que serian si el dado esta bueno, por ello nos vemos inclinados a rechazar la
Hipótesis de que el dado es bueno. Sin embargo, la duda es factible, pues solo por
azar, el 1 podría salir 18 veces, existe una probabilidad mensurable que apoya que
eso es posible, sin que el dado este realmente malo.

Los ensayos, test o contrastes de hipótesis, significación o reglas de decisión, nos


ayudan a decidir si aceptamos o rechazamos las Hipótesis.

Derechos de autor en trámite Página 143 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

14.3 Errores de Tipo I y de Tipo II

Tipo I: Es rechazar H0 lo que escuando es verdad.

Tipo II: Es aceptar H0 cuando es falsa. lo que es falso

Decisión Si es H0 Verdad Si es H0 Falsa


Acepto H0 Decisión correcta Error de Tipo II
Rechazo H0 Error de Tipo I Decisión correcta

Las reglas de decisión se diseñan para que los errores de tipo I y II sean los menores
posibles, pero no es sencillo, pues cuando se minimiza unos de ellos, va en perjuicio
del otro. La única forma de minimizar los dos tipos de errores es aumentando el
tamaño de la muestra, y eso no es siempre posible.

14.4 Nivel de significación

Cuando hacemos un contraste de hipótesis debemos considerar, antes de realizar el


ensayo, cual será el riesgo que estaremos dispuestos dispuetos a correr respecto del
error Tipo I, o sea de rechazar algo que es verdad. Este riesgo, expresado como
probabilidad, e indicado como , será el máximo que estamos dispuesto a tolerar y lo
llamaremos Nivel de Significación del test de Hipótesis.

En la práctica es frecuente un nivel de significación de 0,05 ó 0,01, aunque hay


otros.
Si se escoge 0,05 (5%), al diseñar una regla de decisión, significa que hay 5
oportunidades entre 100 de rechazar la hipótesis cuando se debiera haber aprobado.
Es decir, tenemos un 95% de confianza de que hemos adoptado la decisión
correcta. En este caso decimos que la hipótesis ha sido rechazada al nivel de
significación 0,05, lo cual quiere decir que la hipótesis tiene una probabilidad 0,05 de
ser falsa.

Derechos de autor en trámite Página 144 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

14.5 Contrastes mediante la distribución normal

La figura nos muestra que podemos tener 95% de confianza de que si la hipótesis
es verdadera, el valor de z para un estadístico de la muestra S, estará
comprendida entre -1.96 y +1.96. Por otra parte, si al sacar una muestra y calcular su
estadístico, y determinar su correspondiente valor de z nos da un valor fuera del
intervalo indicado, podremos concluir que dicho evento, podría suceder solo en el
5% de los casos y por ello nos veríamos inclinados a rechazar la hipótesis. Así
decimos que se rechaza a un nivel de significancia del 0.05. o que el valor de z es
significativo al nivel 0.05.
El conjunto de z fuera del rango –1.96 a +1.96 se llama región crítica de la
hipótesis, región de rechazo de la hipótesis o región de significación. El
conjunto de z en el rango interior se conoce como región de aceptación de la
hipótesis o región de no significación.

Derechos de autor en trámite Página 145 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Finalmente, las reglas de decisión, o contraste de hipótesis o significación, son las


siguientes:

Alternativa 1

Rechazar la hipótesis al nivel de significación 0.05 si el valor de z para el estadístico


s esta fuera del rango -1.96 y +1.96. Esto significa que el estadístico de la muestra
es significativo al nivel 0.05.

Alternativa 2

Aceptar la hipótesis en caso contrario o bien, no tomar decisión alguna.

Los ejemplos fueron hechos al nivel 0.05 pero podría ser cualquier otro valor
sustituyendo el 1.96.

La siguiente tabla ilustra las alternativas

Nivel de significancia,  0.10 0.05 0.025 0.01 0.005 0.002


Valores críticos de z para -1.28 o -1.645 o -1.96 o -2.33 o -2.58 o -2.88 o
tests unilaterales +1.28 +1.645 +1.96 +2.33 +2.58 +2.88
Valores críticos de z para -1.645 y -1.96 y -2.24 y -2.58 y -2.81 -3.08 y
tests bilaterales. 1.645 1.96 2.24 2.58 y 2.81 3.08

Derechos de autor en trámite Página 146 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

14.6 Tres distintos niveles de significación:ncia.

Derechos de autor en trámite Página 147 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

En el primero y segundo caso, podríamos aceptar la hipótesis nula de que la media


de la población es igual al valor supuesto, pero en el tercer caso sería rechazada,
pues allí nuestro nivel de significancia, 0.50 está tan alto que rara vez la
aceptaremos, cuando no sea verdadera, pero, al mismo tiempo, frecuentemente la
rechazaremos aunque sea verdadera.

Por otra parte, aún cuando el estadístico de la muestra no caiga en la región crítica
no prueba que la Hipótesis nula es verdadera, simplemente, no ofrece videncia
estadística para rechazarla. La única manera de aceptarla o rechazarla con
certidumbre sería si conociéramos el verdadero valor del parámetro de la población,
pero normalmente ese valor, no lo conocemos.

14.7 Selección de un nivel de significancia

No existe un nivel de significancia “oficial" con el cual probar una hipótesis, en


algunos casos conviene al 5%, en otros el 1% de significancia.

Cuanto más alto sea el nivel de significancia que utilizaremos al probar una
hipótesis, mayores probabilidades habrá de rechazar una hipótesis nula que
sea verdadera, (Error Tipo I).

14.8 Uso de la distribución t para la toma de decisiones.

Luego de decidir que nivel de significancia usar, el siguiente paso en la prueba de


Hipótesis consiste en determinar la distribución adecuada de probabilidad. Tenemos
una opción entre la distribución normal y la distribución t.

Condiciones para usar la Distribución Normal y la distribución t en las pruebas


de hipótesis de medias.

Si se conoce  Si no se conoce 
n > 30 Distribución Normal, tabla z Distribución Normal, tabla z
n ≤ 30 y la población Distribución Normal, tabla z Distribución Student, tabla t
normal o aprox. normal

14.9 Ejercicios de aplicación desarrollados.

Derechos de autor en trámite Página 148 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Ejemplo 1

Una tienda de artículos deportivos ha iniciado una promoción especial para sus
esquís de alta montaña y piensa que la promoción deberá culminar en un cambio de
precio. Sabe que, antes de comenzar la promoción, el precio promedio, al menudeo
del esquí, era de $41,95 con  = $5.36. La tienda saca una muestra en 16 de sus
detallistas y descubre que el precio promedio de los esquís, es ahora $38.95. En un
nivel de significancia de 0.02 ¿tiene motivos para pensar que el precio promedio al
menudeo ha disminuido?

= $38.95 H0 :  = $41.95
n = 16 H1 :  < $41.95
H0 = $41.95 ’ = $ 5.36

Para un nivel de significancia = 0,02 tendremos que z = 2,05, entonces:

41.95-2,05*1.34=39.2

En consecuencia el promedio de la muestra, 38.95 cae en la zona de rechazo y por


ello no se acepta la Hipótesis nula, y la tienda deberá pensar que el precio ha
disminuido.

Ejemplo 2

La comisión promedio que cobran las empresas norteamericanas de servicios


completos de corretaje en las ventas de acciones comunes es de $144, con una
desviación típica de $52. Un corredor ha extraído una muestra de 121
transacciones de sus clientes y determinó que pagaron una comisión promedio de
$151. En un nivel de significación de 0,10, ¿podemos decir que las comisiones de
su cliente son superiores al promedio de la industria?

Derechos de autor en trámite Página 149 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

= $151
n = 121
H0 = $144
’ = $ 52

H0 :  = $144
H1 :  > $144

Para un nivel de significación = 0,10 tendremos que z = 1.28, entonces:

144+1.28*4.73=150

El valor $151 entra en la zona de rechazo.

Se rechaza la Hipótesis nula, las comisiones son significativamente más altas, o


sea se acepta la Hipótesis de alternativa. Y podemos decir que las comisiones son
superiores al promedio de la industria.

Ejemplo 3

Una empresa industrial supone que la vida de sus prensas rotativas es de 14.500
horas, con una desviación típica de 2.100 horas.
De una muestra de 25 prensas la compañía obtiene una media muestral de 13.000
horas. En un nivel de significación de 0,01 ¿debe la compañía concluir que la vida
media de las prensas es menor que las 14.500 supuestas?

= 13.000 Hs. H0 :  = 14.500Hs.


n = 25 H1 :  < 14.500Hs.
H0 = 14.500Hs.
Hs.
’ = 2.100Hs.

Para un nivel de significancia = 0,01 tendremos que z = 2.33, entonces:

14.500 - 2.33 * 420=13.521Hs.

Por lo tanto se rechaza la Hipótesis nula, el promedio de vida es significativamente


más bajo.

Derechos de autor en trámite Página 150 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

14.10 Ejercicios de Aplicación.

El siguiente listado de ejercicios pertenece al libro Estadística de Murray Spieguel,


el alumno deberá resolverlos como parte de su desarrollo académico

Capítulo 10.1, 10.2, 10.6, 10.7, 10.8, 10.9, 10.34, 10.36

Derechos de autor en trámite Página 151 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Capítulo 15
15 Análisis de Varianza

15.1 Distribución F

La razón F llamada también razón de varianzas, se utiliza para probar la hipótesis


referida a la igualdad de dos varianzas poblacionales estimadas. Se la utiliza para
analizar diferencias entre varianzas de muestras.
Supongamos tener una población gaussiana y que extraemos de ella dos muestras
de tamaño n1 y n2 . De cada muestra calculamos la desviación típica, S 1 y S2. La
razón F se expresa así:

El mayor valor de la varianza va colocado como dividendo y el menor como


divisor.

En el caso que se describe donde partimos sacando dos muestras de la misma


población, no tenemos duda de que las varianzas serán muy parecidas y por ello F
será muy próxima a uno.
Cuando no está cerca de uno nos preguntamos si ello puede ser debido al azar o
bien a otra causa, por ejemplo, que las muestras no sean de dos poblaciones iguales.

Esta variable F se distribuye como otras poblaciones de muestreo, y su forma


depende solo de la cantidad de datos que se tengan disponibles para la estimación
del numerador de s2 y los que se tengan para la estimación del denominador

Al final de este capítulo se incluye dos tablas de la distribución F para probabilidad


1% y 5%. Así para n1 = 6 y n2 = 13, el valor crítico es 3.11 (se busca para 5 y 12, es
decir para n-1 grados de libertad). Esto significa que existe una probabilidad del 5%
de obtener una F mayor al 3.11 solo por motivos de azar. Por ello si se supera este
valor, tendremos la posibilidad de rechazar la H0.

El esquema de cálculo se basa en obtener una estimación de la varianza partiendo


de la columnas de los datos que se analizan, esto nos dará una varianza llamada Vc,
luego procedemos a estimar nuevamente la varianza pero desde otro punto de vista,
esto es empleando la relación que existe entre la varianza de una media de muestra
y la varianza de la población.

El esquema siguiente explica el método:

15.2 Análisis de Varianza y Cálculo de F, con una variable de clasificación.

Problema
Los siguientes datos dan los rendimientos de un producto químico, obtenido de
intentar 4 catalizadores diferentes en el proceso. Probar que los rendimientos se ven
afectados por los catalizadores. Se solicita probar con una probabilidad de
equivocarse del 5%, que los catalizadores afectan al rendimiento, por ello partiremos

Derechos de autor en trámite Página 152 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

de la H0 = 1=2=3=4 . Este planteo es lo opuesto. Es decir si H0 fuera cierta, los


catalizadores no producen efecto en los rendimientos. Los datos experimentales son:

Cálculo de la varianza de las medias:


(variabilidad entre las columnas, variación
entre tratamientos)
I II III IV
36 35 35 34
33 37 39 31
35 36 37 35
34 35 38 32
32 37 39 34
34 36 38 33

34.00 36.00 37.67 33.17

Cálculo de F:
Cálculo de las varianzas por columnas: (variabilidad
dentro de las columnas, dentro del tratamiento)

n-1 1.41 0.89 1.51 1.47

2 2.00 0.79 2.28 2.16

De tablas al 5%: Conclusión:

Para: V1 = 3 y V2 = 20 Se rechaza la Hipótesis de que


el catalizador no tiene efecto en
Es : F0=3.10 los rendimientos.

Derechos de autor en trámite Página 153 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

Distribuciones de F 1%

1% 1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 40 100
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 6143 6170 6209 6286 6334
2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,41 99,42 99,43 99,44 99,45 99,48 99,49
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,13 27,05 26,92 26,83 26,69 26,41 26,24
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37 14,25 14,15 14,02 13,75 13,58
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89 9,77 9,68 9,55 9,29 9,13
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72 7,60 7,52 7,40 7,14 6,99
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47 6,36 6,28 6,16 5,91 5,75
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,73 5,67 5,56 5,48 5,36 5,12 4,96
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11 5,01 4,92 4,81 4,57 4,41
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,77 4,71 4,60 4,52 4,41 4,17 4,01
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40 4,29 4,21 4,10 3,86 3,71
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16 4,05 3,97 3,86 3,62 3,47
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96 3,86 3,78 3,66 3,43 3,27
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80 3,70 3,62 3,51 3,27 3,11
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67 3,56 3,49 3,37 3,13 2,98
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,62 3,55 3,45 3,37 3,26 3,02 2,86
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46 3,35 3,27 3,16 2,92 2,76
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,43 3,37 3,27 3,19 3,08 2,84 2,68
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30 3,19 3,12 3,00 2,76 2,60
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,29 3,23 3,13 3,05 2,94 2,69 2,54
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,24 3,17 3,07 2,99 2,88 2,64 2,48
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,18 3,12 3,02 2,94 2,83 2,58 2,42
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,14 3,07 2,97 2,89 2,78 2,54 2,37
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,09 3,03 2,93 2,85 2,74 2,49 2,33
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 3,06 2,99 2,89 2,81 2,70 2,45 2,29
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 3,02 2,96 2,86 2,78 2,66 2,42 2,25
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,99 2,93 2,82 2,75 2,63 2,38 2,22
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,96 2,90 2,79 2,72 2,60 2,35 2,19
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,93 2,87 2,77 2,69 2,57 2,33 2,16
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,91 2,84 2,74 2,66 2,55 2,30 2,13
31 7,53 5,36 4,48 3,99 3,67 3,45 3,28 3,15 3,04 2,96 2,88 2,82 2,72 2,64 2,52 2,27 2,11
32 7,50 5,34 4,46 3,97 3,65 3,43 3,26 3,13 3,02 2,93 2,86 2,80 2,70 2,62 2,50 2,25 2,08
33 7,47 5,31 4,44 3,95 3,63 3,41 3,24 3,11 3,00 2,91 2,84 2,78 2,68 2,60 2,48 2,23 2,06
34 7,44 5,29 4,42 3,93 3,61 3,39 3,22 3,09 2,98 2,89 2,82 2,76 2,66 2,58 2,46 2,21 2,04
35 7,42 5,27 4,40 3,91 3,59 3,37 3,20 3,07 2,96 2,88 2,80 2,74 2,64 2,56 2,44 2,19 2,02
36 7,40 5,25 4,38 3,89 3,57 3,35 3,18 3,05 2,95 2,86 2,79 2,72 2,62 2,54 2,43 2,18 2,00
37 7,37 5,23 4,36 3,87 3,56 3,33 3,17 3,04 2,93 2,84 2,77 2,71 2,61 2,53 2,41 2,16 1,98
38 7,35 5,21 4,34 3,86 3,54 3,32 3,15 3,02 2,92 2,83 2,75 2,69 2,59 2,51 2,40 2,14 1,97
39 7,33 5,19 4,33 3,84 3,53 3,30 3,14 3,01 2,90 2,81 2,74 2,68 2,58 2,50 2,38 2,13 1,95
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66 2,56 2,48 2,37 2,11 1,94
41 7,30 5,16 4,30 3,81 3,50 3,28 3,11 2,98 2,87 2,79 2,71 2,65 2,55 2,47 2,36 2,10 1,92
42 7,28 5,15 4,29 3,80 3,49 3,27 3,10 2,97 2,86 2,78 2,70 2,64 2,54 2,46 2,34 2,09 1,91
43 7,26 5,14 4,27 3,79 3,48 3,25 3,09 2,96 2,85 2,76 2,69 2,63 2,53 2,45 2,33 2,08 1,90
44 7,25 5,12 4,26 3,78 3,47 3,24 3,08 2,95 2,84 2,75 2,68 2,62 2,52 2,44 2,32 2,07 1,89
Distribuciones de F 5%

5% 1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 40 100
1 161 199 216 225 230 234 237 239 241 242 243 244 245 246 248 251 253
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,42 19,43 19,45 19,47 19,49

Derechos de autor en trámite Página 154 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor


Estadística para ingenieros y técnicos de Institutos profesionales Autor: Edgardo Ojeda Barcos

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,71 8,69 8,66 8,59 8,55
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91 5,87 5,84 5,80 5,72 5,66
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,64 4,60 4,56 4,46 4,41
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,96 3,92 3,87 3,77 3,71
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57 3,53 3,49 3,44 3,34 3,27
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,24 3,20 3,15 3,04 2,97
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,03 2,99 2,94 2,83 2,76
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,86 2,83 2,77 2,66 2,59
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,74 2,70 2,65 2,53 2,46
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,64 2,60 2,54 2,43 2,35
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,55 2,51 2,46 2,34 2,26
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53 2,48 2,44 2,39 2,27 2,19
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,42 2,38 2,33 2,20 2,12
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42 2,37 2,33 2,28 2,15 2,07
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,33 2,29 2,23 2,10 2,02
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,29 2,25 2,19 2,06 1,98
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,26 2,21 2,16 2,03 1,94
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,22 2,18 2,12 1,99 1,91
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25 2,20 2,16 2,10 1,96 1,88
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23 2,17 2,13 2,07 1,94 1,85
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20 2,15 2,11 2,05 1,91 1,82
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18 2,13 2,09 2,03 1,89 1,80
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16 2,11 2,07 2,01 1,87 1,78
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15 2,09 2,05 1,99 1,85 1,76
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13 2,08 2,04 1,97 1,84 1,74
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 2,06 2,02 1,96 1,82 1,73
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10 2,05 2,01 1,94 1,81 1,71
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09 2,04 1,99 1,93 1,79 1,70
31 4,16 3,30 2,91 2,68 2,52 2,41 2,32 2,25 2,20 2,15 2,11 2,08 2,03 1,98 1,92 1,78 1,68
32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14 2,10 2,07 2,01 1,97 1,91 1,77 1,67
33 4,14 3,28 2,89 2,66 2,50 2,39 2,30 2,23 2,18 2,13 2,09 2,06 2,00 1,96 1,90 1,76 1,66
34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12 2,08 2,05 1,99 1,95 1,89 1,75 1,65
35 4,12 3,27 2,87 2,64 2,49 2,37 2,29 2,22 2,16 2,11 2,07 2,04 1,99 1,94 1,88 1,74 1,63
36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15 2,11 2,07 2,03 1,98 1,93 1,87 1,73 1,62
37 4,11 3,25 2,86 2,63 2,47 2,36 2,27 2,20 2,14 2,10 2,06 2,02 1,97 1,93 1,86 1,72 1,62
38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 2,05 2,02 1,96 1,92 1,85 1,71 1,61
39 4,09 3,24 2,85 2,61 2,46 2,34 2,26 2,19 2,13 2,08 2,04 2,01 1,95 1,91 1,85 1,70 1,60
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00 1,95 1,90 1,84 1,69 1,59
41 4,08 3,23 2,83 2,60 2,44 2,33 2,24 2,17 2,12 2,07 2,03 2,00 1,94 1,90 1,83 1,69 1,58
42 4,07 3,22 2,83 2,59 2,44 2,32 2,24 2,17 2,11 2,06 2,03 1,99 1,94 1,89 1,83 1,68 1,57

Derechos de autor en trámite Página 155 de 155

Uso académico exclusivo, prohibida su reproducción sin consentimiento del autor

También podría gustarte